---
tags: [chapter, ch05, foundation-model, CHGNet, MatterSim]
status: 完成
confidence: high
sources:
  - ../repo-analysis/chgnet.md
  - ../repo-analysis/mattersim.md
  - ../repo-analysis/comparison-table.md
last_updated: 2026-06-11
---

# Chapter 5：CHGNet / MatterSim 與預訓練材料模型

> **一句話**：foundation model 是「先看過幾百萬筆 DFT 的通用勢能」——bulk 近平衡的問題拿來就能用；表面、吸附、磁性、高能態是危險區。這章不教工具，教**可信度判斷框架**：怎麼判斷、怎麼查、什麼時候必須微調。

## 這章要解決的問題

Ch2–Ch4 的路線要自備 DFT 資料。但很多時候你的需求是「**現在就要一個大概**」：投稿前快速 relax 一批候選結構、篩掉明顯不穩定的組成、給 spin-polarized 計算一個合理的初始磁矩。預訓練模型（pretrained universal MLIP，又稱 materials foundation model）給你這個選項——`pip install`、載入權重、直接算。

問題是「能算」與「可信」之間隔著一整章的距離。模型不會在輸出旁邊標註「這個數字我其實在外推」。**建立你自己的判斷框架**，是這章唯一的目標。

## 給化學系學生的直覺說法

**Foundation model ＝ 讀完整個 Materials Project 的學生。** 常見無機晶體的題目（考古題）它答得又快又好；你的 HEA 表面吸附（超綱題）它也會作答——用一樣自信的表情。

**三個檔位**，對應投入成本遞增：

| 檔位 | 做法 | 類比 |
|---|---|---|
| zero-shot | 下載權重直接用 | 直接考它 |
| fine-tune | 用你的少量 DFT 資料再訓練 | 給它補習你的體系 |
| active learning | 讓模型標出沒把握的構型、送 DFT、迭代 | 它自己畫重點，你出考題 |

**兩位代表選手的個性**：

- **CHGNet** 會「看價態」——它把 DFT 磁矩（magmom）當第四個訓練標籤，所以能分辨 Mn³⁺/Mn⁴⁺、追蹤 Li 脫嵌時的氧化態變化。Materials Project 生態系的親兒子，安裝門檻全場最低。
- **MatterSim** 見過「極端條件」——訓練資料涵蓋 0–5000 K、0–1000 GPa，所以高溫高壓 MD 不容易一出井就亂掉。微軟出品，開源版是 M3GNet 架構的社群版。

**危險區的記法只有一句**：離 bulk 平衡態越遠越危險——表面 > 缺陷 > 過渡態；磁性與電化學界面加倍。

## 核心概念

### 1. 訓練資料決定能力邊界

| | CHGNet | MatterSim（v1 開源版） |
|---|---|---|
| 訓練資料 | MPtrj：158 萬結構，全部來自 MP 的 **bulk** 鬆弛軌跡（PBE+U） | ~1700 萬結構，跨元素、0–5000 K、0–1000 GPa（PBE） |
| 預測量 | E / F / S / **magmom** | E / F / S |
| 參數量 | ~41 萬 | 88 萬（1M 版）／450 萬（5M 版） |
| zero-shot 精度 | energy MAE ~29 meV/atom（分布內 test） | ~24–30 meV/atom（分布內）；**~0.2 eV/atom（分布外 Random-TP）** |
| 強項 | 價態追蹤、MAGMOM 初猜、MP 生態整合 | 溫壓覆蓋、phonon 工作流、批次篩選 |

讀表的重點不是誰比較強，是那一行對比：**同一個 MatterSim，分布內 0.03、分布外 0.2 eV/atom——差了快一個數量級**。「在哪裡可信」比「多準」重要。

### 2. 理論層級繼承：模型＝functional 的代理

CHGNet 學的是「MP 風格的 PBE+U＋MP2020 修正」這個參考系；MatterSim 學的是 PBE。這意味著：(a) PBE 的毛病（強關聯、vdW）它們照單全收；(b) 它們的能量與你自己的 VASP 能量**參考系不同，不能直接混算**——又是那條實驗室規則：有 functional 才能比較能量。

### 3. Softening：bulk 訓練的系統性偏軟

證據鏈（細節與來源見 [comparison-table.md](../repo-analysis/comparison-table.md) 第 4 節）：CHGNet、MACE-MP-0、M3GNet 這批 bulk 軌跡訓練的模型，對表面能、缺陷形成能、遷移能障、高能構型**一致性低估**（勢能面「偏軟」）。機制正是 Ch2 教的訓練分布偏差：訓練資料是鬆弛軌跡的快照，勢能面的「牆壁」沒人教過它。後果具體化：zero-shot 吸附能方向性偏軟、80 個 MLIP 的異相催化 benchmark 中**磁性體系災難性失敗**、模型自己 relax 再算比 single-point 誤差更大。

你可以在 [`notebooks/pretrained-model-concept-demo.ipynb`](../../notebooks/pretrained-model-concept-demo.ipynb) 親手重現 softening 的玩具版：只用近平衡樣本訓練，預測整條勢能曲線——牆壁塌下來給你看。

### 4. 安全用法 SOP（直接背）

- ✅ **安全**：DFT 前的 pre-relaxation；bulk 形成能/穩定性初篩；MD 退火生成候選構型；CHGNet 給 spin-polarized VASP 的 `MAGMOM` 初猜
- ⚠️ **定性可、定量不可**：表面能、吸附能、能障的 zero-shot 數值——只能拿來排序初篩，不能進論文
- ❌ **不要做**：拿 zero-shot 吸附能畫 HER/OER 火山圖；電化學界面（電位、溶劑、帶電 slab）；磁性氧化物界面不經驗證直接用

### 5. Leaderboard 素養：榜單會過期，查法不會

Matbench Discovery 是這個領域的公開排行榜（看 F1：找出穩定材料的能力；κ_SRME：聲子/熱導品質）。2026-06 快照：前段班幾乎全是 OAM 配方（OMat24+sAlex+MPtrj 訓練）；MatterSim-5M 第 22、MACE-MPA-0 第 24、CHGNet 第 44（共 47 個模型）。

**CHGNet 排第 44 為什麼還教它？** 因為它是「第一代 charge-informed universal MLIP」的概念原型——magmom 的化學意義、MPtrj 的偏差結構，這些**概念**不過期；而它從 2023 年的 SOTA 變成 2026 年的後段班，這件事本身就是最好的教材：**這個領域三個月洗一次牌，背榜單沒有用，要學的是查榜單**。（CHGNet 官方也已把開發遷移到 MatGL，repo 進入 legacy 維護。）

### 6. License 素養

| 可商用 | 學術限定 | 有條件 |
|---|---|---|
| MACE-MPA-0（MIT）、MatterSim（MIT）、CHGNet（BSD）、Orb-v3（Apache-2.0） | MACE-OMAT/OFF/MH、GRACE（ASL） | UMA（可商用但 gated＋地區排除）、SevenNet（GPL-3.0） |

拿到任何新模型，先查三件事：**訓練資料、license、離你體系最近的 benchmark**。

## 和 DFT / 材料 / 催化的關係

把 SOP 翻譯到 HEA 電催化的日常：

- bulk 端（合金穩定性、偏析傾向初篩、SQS 構型生成）→ zero-shot 可用，CHGNet 或 MACE-MPA-0
- 含 Fe/Co/Ni 的自旋極化 VASP → 先用 CHGNet 要一份 magmom 當 `MAGMOM` 初猜，常省一兩輪收斂
- 表面吸附能 → **必走微調路線**（Ch4 的協議），zero-shot 只當位點粗篩
- 電位相關（V vs RHE 下的界面）→ 全部超綱，老老實實 CHE 近似＋DFT

## 最小數學

本章沒有新數學，只有一張**誤差量級對照表**——它本身就是結論：

| 量 | 數量級 |
|---|---|
| 模型分布內 MAE | ~0.03 eV/atom |
| 模型分布外 MAE（MatterSim Random-TP 實測） | ~0.2 eV/atom |
| HER 火山圖上你要分辨的活性差 | ~0.1–0.2 eV |

分布外誤差 ≳ 你要分辨的訊號 → zero-shot 吸附能讀不出火山圖的結構。一行比較，勝過十頁勸告。

## 最小 code

**Level 1（pseudo-code）**

```text
structure → pretrained model → relax / MD / 初篩
   └─ 要定量？ → 用自家 DFT 微調 → hold-out 驗證 → 才上生產
```

**Level 2a（CHGNet 五行）**

```python
from chgnet.model import CHGNet
from pymatgen.core import Structure

model = CHGNet.load()                      # 權重隨套件內建，離線可用
s = Structure.from_file("LiMnO2.cif")
print(model.predict_structure(s))          # e / f / s / magmom 一次到手
```

**Level 2b（MatterSim 當 ASE calculator）**

```python
from mattersim.forcefield import MatterSimCalculator
from ase.build import bulk

atoms = bulk("Si")
atoms.calc = MatterSimCalculator()         # 預設 MatterSim-v1.0.0-1M
print(atoms.get_potential_energy())
```

**Level 3（real repo pointer）**

- CHGNet：`examples/basics.ipynb`（README 附 Colab 徽章，保底教學路線）、`examples/fine_tuning.ipynb`、`chgnet.utils.parse_vasp_dir()`（把你的 VASP 目錄變微調資料）
- MatterSim：`docs/examples/`（relax/phonon/batch）、微調腳本 `src/mattersim/training/finetune_mattersim.py`；**Windows 無原生 wheel，走 WSL2 或 Colab（Python ≥3.12）**
- 排行榜：matbench-discovery.materialsproject.org

## 常見誤解

- **「leaderboard 第一名＝對我的體系最好。」** 榜測的是 bulk 穩定性篩選與聲子，不是你的表面吸附。離你體系最近的 benchmark 才算數。
- **「MAE 30 meV/atom，所以吸附能誤差 30 meV。」** 那是分布內的每原子指標；吸附能是分布外的能量差，誤差來源完全不同。
- **「CHGNet 過時了，不用學。」** 工具過時，概念沒有。charge-informed 的想法、MPtrj 的偏差結構，是你判斷下一代模型的座標系。
- **「fine-tune 一定變好。」** functional 不對齊、參考能量（AtomRef/E0s）沒重擬合的微調，會把模型拉到一個錯的參考系——更糟。

## 小練習

1. 打開 Matbench Discovery：找出本月前三名、它們的訓練資料與 license，判斷各自能否用於產學案。（練的是查法，不是答案。）
2. 用 CHGNet relax 一個你熟悉的結構，與你的 VASP 結果比鍵長與體積。差多少 %？這個差距對你的應用可接受嗎？
3. 寫一張「該不該信 zero-shot」檢查卡（四項：訓練分布涵蓋嗎？磁性？參考系一致？誤差量級 vs 我要分辨的差異？），貼在螢幕邊。

## 延伸閱讀

- Deng et al., *Nat. Mach. Intell.* (2023)：CHGNet 原文——讀 magmom 作為 charge proxy 那一節
- Deng et al., *npj Comput. Mater.* **11**, 9 (2025)：softening 論文，本章第 3 節的證據主體
- MatterSim `MODEL_CARD.md`：官方限制聲明，「表面定量不可信、建議微調」是原文，值得整段讀
- [repo-analysis/chgnet.md](../repo-analysis/chgnet.md)、[repo-analysis/mattersim.md](../repo-analysis/mattersim.md)

## 我學完後應該能說出什麼

- 「foundation model 的能力邊界由訓練資料決定；我能各舉三個安全與危險用法。」
- 「softening 是什麼、為什麼發生、對吸附能與火山圖意味著什麼。」
- 「拿到新模型先查三件事：訓練資料、license、離我體系最近的 benchmark。」

---

### 本章配套

- notebook：[`notebooks/pretrained-model-concept-demo.ipynb`](../../notebooks/pretrained-model-concept-demo.ipynb)（softening 玩具重現＋zero-shot vs fine-tune＋Colab 真跑）
- 投影片：[`slides/ch05-pretrained-models.html`](../../slides/ch05-pretrained-models.html)
- 練習題（含詳解）：[`exercises/ch05.md`](../../exercises/ch05.md)