# Ch5 練習題：預訓練材料模型

> 概念 2 題＋查證實作 2 題。詳解在最後。

## 題目

**Q1（安全分類）** 把下列用法標為 ✅ 安全 / ⚠ 定性可定量不可 / ❌ 不要做，各加一句理由：
(a) 用 CHGNet 把 300 個候選 bulk 結構先 relax 再送 DFT
(b) 用 MatterSim zero-shot 算 PtNi(111) 的 *OH 吸附能，畫進火山圖投稿
(c) 用 CHGNet 的 magmom 當 spin-polarized VASP 的 MAGMOM 初猜
(d) 用 zero-shot 模型比較 20 種 HEA 組成的「相對」吸附強弱當初篩
(e) 用 foundation model 模擬 0.8 V vs RHE 下的電化學界面

**Q2（量級判斷）** 模型 A 分布內 MAE = 25 meV/atom。你要分辨兩個組成的 ΔG_H 差 0.08 eV，而你的問題（HEA 表面吸附）屬於分布外。用 Ch5 的量級對照邏輯，寫 4–6 句判斷「能不能直接用 A」，並給出代替方案。

**Q3（查榜任務）** 打開 Matbench Discovery：
(a) 記錄本日前三名模型、訓練資料、license。
(b) 找出 CHGNet 與 MACE-MPA-0 目前的名次。
(c) 寫三句話：這個榜測的是什麼能力？它跟「你的表面吸附問題」的距離在哪？

**Q4（softening 重現）** 跑 `notebooks/pretrained-model-concept-demo.ipynb` 第 2 節。
(a) 記錄谷底/斥力牆/解離區三個誤差。
(b) 把訓練窗從 (0.95, 1.30)r₀ 擴成 (0.85, 1.80)r₀，三個誤差怎麼變？
(c) 用一句話把這個觀察翻譯成「OMat24 為什麼改善表面性質」的解釋。

---

## 詳解

**A1**
(a) ✅ pre-relaxation 是教科書級安全用法——最後有 DFT 把關。
(b) ❌ zero-shot 吸附能直接進火山圖是本章明文禁區（softening＋分布外誤差 ≳ 訊號）。
(c) ✅ README 明文建議的用途；猜錯頂多多幾輪 SCF。
(d) ⚠ 相對排序當初篩可以，但要抽查幾個點對 DFT，且磁性體系加倍小心。
(e) ❌ 電位、溶劑、帶電 slab 全在訓練範圍外——目前的 foundation model 沒有這些物理。

**A2** 要點：分布外誤差通常遠大於分布內 MAE（MatterSim 實測 25–30 meV/atom → 0.2 eV/atom，放大近一個量級）；0.08 eV 的訊號會被淹沒 → **不能直接用**。代替方案：用自家 HEA slab DFT 資料微調 A（hold-out RMSE 壓到 < 0.05 eV 再用），或至少對這兩個組成各抽 N 個位點做 DFT 直接比。

**A3** (a)(b) 以當日榜面為準——這題的分數在「查的動作」。
(c) 參考：榜測的是「從組成/結構預測 bulk 熱力學穩定性」與聲子品質；它不含吸附質、不含表面，所以**榜首 ≠ 你的吸附問題最佳解**；它的價值是讓你看清「訓練資料配方」的演進方向（OAM 配方稱霸＝非平衡資料的勝利）。

**A4**
(a) notebook 預設種子：谷底 0.000 / 斥力牆 0.138 / 解離區 0.634 eV。
(b) 訓練窗擴大後，牆與解離區誤差大幅下降（樣本「看過」那裡了）——谷底幾乎不變。
(c) OMat24 之類的資料集刻意涵蓋非平衡構型（rattled、高溫），等於把訓練窗擴到牆上——所以用它訓練的模型表面能/高能態明顯改善。**資料覆蓋決定能力邊界，再次驗證。**