---
tags: [chapter, ch06, HEA, HER, active-site, distribution]
status: 完成
confidence: high
sources:
  - ../repo-analysis/mace.md
  - ../repo-analysis/comparison-table.md
last_updated: 2026-06-11
---

# Chapter 6：研究應用——HEA 的 active-site distribution

> **一句話**：HEA 催化劑的活性不由「一個描述符」決定，而由「吸附能分布裡落在 near-optimal window 的位點族群」決定。MLIP 的角色，是把這個分布從「DFT 抽樣幾十點」升級成「幾萬點的統計」。這章是前六章所有工具在一個真實研究問題上的集合演出。

## 這章要解決的問題

純金屬與簡單合金的時代，催化劑設計有一條漂亮的捷徑：一個表面 ≈ 一種位點 ≈ 一個 ΔG_H，往火山圖上一放，一點定生死。Sabatier 原理告訴你 ΔG_H ≈ 0 最好——吸太強，H* 下不來（脫附限速）；吸太弱，H* 上不去（吸附限速）。

高熵合金把這條捷徑拆了。五種元素隨機佔據晶格，**同一個表面上每個位點的局部成分環境都不一樣**——Ch0 算過那個數字：一個 top 位點的第一配位圈就有 5⁹ ≈ 2×10⁶ 種組合。ΔG_H 不再是一個數，是一個**分布**。

這帶來兩個層面的挑戰：

- **概念層**：研究問題從「這個表面的 ΔG_H 是多少」變成「這個組成的 ΔG_H **分布長什麼樣**、落在活性窗口內的位點**佔多少**」。
- **計算層**：要把一條分布刻畫清楚，需要掃幾千到幾萬個位點——純 DFT 做不到。這正是 Ch2–Ch5 的 MLIP 工具鏈進場的地方。

## 給化學系學生的直覺說法

**純金屬像全班都是同一個人，HEA 像一整班個性各異的學生。** 班級的考試表現不由「平均的那個虛構學生」決定，而由「剛好擅長這份考卷的那群人」決定。near-optimal window（|ΔG_H| ≤ w，本課程預設 w = 0.1 eV）圈出的就是這群主力。

**「你是誰」不如「你跟誰坐」。** 同樣是 Ni 位點，旁邊站的是 Mo 還是 Cu，ΔG_H 可以差零點幾 eV——這就是**局部成分效應**，它把五根離散的「純金屬能階」抹成一條連續的「能譜」。你可以在互動 demo 裡親手做這個實驗：把「局部成分效應強度 λ」滑桿從 0 拉到 1，看直方圖從五根尖峰熔成一座連續山丘。

**請打開互動 demo**：[`interactive/hea-active-site-distribution.html`](../../interactive/hea-active-site-distribution.html)。操作劇本：(1) 等莫耳組成起手，看 θ_active 的基準值；(2) 把 Cu 拉到 50%——強吸附的 Mo/Fe 被稀釋，分布右移穿過零點，θ_active 先升後降；(3) 把窗口寬 w 從 0.10 調到 0.05 eV，看「最適組成」會不會變（會！）；(4) 按重新佈點幾次，看同組成不同隨機佔位下 θ_active 的漲落——這就是統計不確定度，notebook 用 bootstrap 把它量化。

## 核心概念（研究工作流主軸）

整章就是這條鏈，逐站講清楚：

```text
HEA surface（隨機佔位模型）
   ↓ ① DFT sampling（幾十~幾百個位點）
adsorption energy distribution（ΔG_H 直方圖）
   ↓ ② near-optimal window
active-site population θ_active
   ↓ ③ MLIP / MACE 加速 sampling（×100 的統計力）
   ↓ ④ microkinetic interpretation
組成 → 活性的設計迴圈
```

### ① DFT 抽樣：分布的「地面真相」

幾十～幾百個位點的 DFT 計算，承擔兩個角色：MLIP 的訓練/微調資料，以及最終驗證的 hold-out 基準。抽樣設計用 Ch2 的語言：**分層抽**（按位點中心元素、按局部組成分層）比純隨機更快覆蓋分布的兩翼；表面模型用隨機佔位或 SQS（special quasirandom structure）。

### ② 分布與 θ_active：新的設計目標

$$\theta_{\text{active}} = \frac{N(|\Delta G_H| \le w)}{N_{\text{total}}}$$

窗口寬 w 怎麼選？它來自火山圖在頂點附近的曲率——對 HER，|ΔG_H| 在 0.1–0.2 eV 內的位點對交換電流的貢獻仍在峰值的同一個數量級，所以 w = 0.1 eV 是常見而可辯護的選擇。**但 θ_active 對 w 的選擇敏感**，所以誠實的做法是報告 θ_active(w) 對幾個 w 值的結果（demo 的滑桿就是讓你練這件事）。

### ③ MLIP 加速：從幾十點到幾萬點

這一步把 Ch4 的微調協議原封不動搬過來：

1. 自家 HEA slab DFT 資料（含 forces！）→ extxyz
2. `mace_run_train --foundation_model="medium-mpa-0" --multiheads_finetuning=True --E0s="estimated"`
3. **hold-out 驗證**：留一組 DFT 算過的吸附能當考卷，目標 RMSE < 0.05–0.1 eV（低於窗口寬，否則分類會錯位）
4. 通過才掃位點：幾萬個位點的 ΔG_H，一夜之間

為什麼不能 zero-shot？Ch5 的證據鏈：bulk 訓練的 foundation model 對表面系統性偏軟，0.2 eV 等級的分布外誤差會把 0.1 eV 寬的窗口整個淹掉。**微調不是選配，是這條工作流的入場券。**

### ④ 統計不確定度：為什麼「多」本身就是價值

50 個 DFT 點估出來的 θ_active，自己就有取樣誤差。用 bootstrap 量化：對 50 點重抽樣 1000 次，θ_active 的 95% 信賴區間寬得讓你不敢比較兩個組成；同樣的分析放到 MLIP 的 10⁴ 點上，區間縮到可以做設計決策。**MLIP 買到的不是「更快」，是「統計上站得住的分布」**——這是對審稿人最有力的說法。notebook 第 4 節把這兩條信賴區間並排畫給你看。

### ⑤ Microkinetic 詮釋：從族群到電流

最簡單的橋：把每個位點當獨立通道，交換電流密度正比於「火山權重」的位點加總

$$j_0 \propto \sum_{\text{sites}} f(\Delta G_i), \qquad f(\Delta G) = e^{-|\Delta G|/k_BT}$$

f 在 ΔG=0 處峰值——這是把單點火山圖「分布化」的最小模型。它忽略了位點間的耦合（覆蓋度、側向交互作用、H 的表面擴散），所以是詮釋的起點不是終點；但它已經能回答設計問題：**兩個組成，θ_active 一樣時，分布形狀（窄而正 vs 寬而跨零）誰更好？** notebook 用這個權重函數讓你自己算答案。

## 和 DFT / 材料 / 催化的關係

把所有單位與參考系的紀律集中在這裡：

- **CHE 近似**：ΔG_H = ΔE_H + ΔZPE − TΔS ≈ ΔE_H + 0.24 eV（H* 的標準修正值；你的體系該用自己算的 ZPE）
- **吸附能定義**：E_ads = E(slab+H) − E(slab) − ½E(H₂)，三項**同一套 DFT 設定**（functional、k 點、截斷能），微調資料也是同一套——鏈上任何一環換了設定，分布整體平移，θ_active 就是錯的
- **電位**：本章所有能量在 0 V vs RHE 的 CHE 框架下；外加電位用 ΔG(U) = ΔG − eU 平移
- **與 d-band center 的關係**：descriptor 沒有死——它從「預測單點」轉職成「解釋分布形狀」（為什麼 Mo 鄰居把 Ni 位點拉向強吸附？d-band 語言依然是最好的說法）

## 最小數學

三條式子撐起全章：θ_active 的定義（上）、火山權重 j₀ ∝ Σf(ΔG)（上）、以及 demo/notebook 用的玩具模型——**明示為教學 mock，非 DFT**：

$$\Delta G(\text{site}) = (1-\lambda)\,\varepsilon(\text{自身元素}) + \lambda\,\langle \varepsilon(\text{鄰居}) \rangle + \mathcal{N}(0, \sigma)$$

λ 是局部成分效應強度：λ=0 退化成五根純金屬尖峰；λ→1 完全由鄰居平均決定、趨向單一高斯（中央極限定理在表面上的演出）。真實體系介於中間——這個模型的價值是讓你**先有分布的直覺**，再去算真的。

## 最小 code

**Level 1（pseudo-code）**

```text
generate HEA surface (random occupation, composition x)
for each site: ΔG = f(local environment)     # 教學: 玩具模型 / 研究: 微調 MACE
histogram(ΔG) → θ_active = P(|ΔG| ≤ w)
sweep composition x → θ_active(x) → 設計建議
bootstrap → θ_active 的信賴區間
```

**Level 2（minimal Python：模型核心 15 行）**

```python
import numpy as np
rng = np.random.default_rng(7)

EPS = {"Fe": -0.42, "Co": -0.18, "Ni": -0.05, "Cu": 0.30, "Mo": -0.55}  # 示意值！
elems, comp = list(EPS), [0.2, 0.2, 0.2, 0.2, 0.2]
L, lam, w = 40, 0.45, 0.10

grid = rng.choice(len(elems), size=(L, L), p=comp)            # 隨機佔位
eps  = np.vectorize(lambda k: EPS[elems[k]])(grid)
nbr  = sum(np.roll(eps, s, axis=a) for s in (1, -1) for a in (0, 1)) / 4
dG   = (1 - lam)*eps + lam*nbr + rng.normal(0, 0.06, (L, L))   # 玩具模型
theta = np.mean(np.abs(dG) <= w)
print(f"θ_active = {theta:.1%}  ({L*L} sites)")
```

完整版（直方圖、組成掃描、bootstrap、火山權重）在 [`notebooks/hea-adsorption-distribution-demo.ipynb`](../../notebooks/hea-adsorption-distribution-demo.ipynb)。

**Level 3（real repo pointer：把玩具換成真的）**

- 表面模型：ASE `fcc111()` ＋ 隨機佔位（或 icet/ATAT 生成 SQS）
- ΔG 引擎：微調後的 MACE 掛 ASE calculator 批次算位點（`mace_eval_configs` 做批次推論）
- 驗證：自家 VASP hold-out 集 ＋ parity plot；分布尾巴（極強/極弱位點）回 DFT 抽查——**尾巴是外推高風險區，也常是審稿人最先戳的地方**

## 常見誤解

- **「平均組成決定活性。」** 局部成分效應讓同組成的位點彼此差到 0.5 eV；只看平均等於只看那個虛構的「平均學生」。
- **「分布算出來了就是真的。」** 玩具模型給直覺；定量分布的前提是「微調＋hold-out RMSE < 窗口寬」。沒過這關的分布是裝飾品。
- **「θ_active 越大越好，沒有但書。」** 但書至少三條：位點的可及性（被毒化/被覆蓋）、穩定性（偏析、溶解，電化學條件下尤其）、以及覆蓋度效應改變 ΔG 本身。θ_active 是設計羅盤，不是保證書。
- **「MLIP 掃出來的極端位點最令人興奮。」** 也最可能是外推假象。先 DFT 抽查，再興奮。

## 小練習

1. 在 demo 裡找出「θ_active 最大」的組成；把 w 從 0.10 改成 0.05 eV，最適組成變了嗎？用「分布形狀 vs 窗口寬」解釋為什麼。
2. λ 調到 0 與 1，各對應什麼物理極限？真實 HEA 的 λ 由什麼決定？（提示：d 軌域的空間範圍、配位數、應變的長程性。）
3. 設計你自己體系的驗證協議：DFT 抽幾個點、怎麼分層、接受標準（RMSE vs w 的關係）、尾巴抽查的規則。寫成半頁、可以直接放進 SI 的那種。

## 延伸閱讀

- [comparison-table.md](../repo-analysis/comparison-table.md) 第 4 節：表面吸附風險的文獻證據鏈（softening、80-MLIP benchmark、磁性體系警訊）
- [repo-analysis/mace.md](../repo-analysis/mace.md)：微調協議與 HEA 對接的完整細節
- HEA active-site 分布的代表性文獻：建議從實驗室文獻庫挑 2–3 篇精讀（用 Ch1 的工具查「high entropy alloy adsorption energy distribution HER」，然後抽查引用——學以致用）

## 我學完後應該能說出什麼

- 「為什麼 HEA 要用 population 思維取代單一描述符思維——以及那個 5⁹ 的數字。」
- 「θ_active 怎麼定義、對 w 敏感、組成怎麼改變它；MLIP 買到的是統計上站得住的分布。」
- 「從 DFT 抽樣到 MLIP 大規模掃描的完整閉環，與每一站的驗證點——微調是入場券，尾巴要抽查。」

---

### 本章配套

- 互動 demo：[`interactive/hea-active-site-distribution.html`](../../interactive/hea-active-site-distribution.html) ✓ 已驗證（FeCoNiCuMo 示意組成，ε 頁面內可調）
- notebook：[`notebooks/hea-adsorption-distribution-demo.ipynb`](../../notebooks/hea-adsorption-distribution-demo.ipynb)
- 投影片：[`slides/ch06-hea.html`](../../slides/ch06-hea.html)
- 練習題（含詳解）：[`exercises/ch06.md`](../../exercises/ch06.md)
- ⚠️ 待實際研究體系確定後，demo 預設組成與本章案例同步更換（10 分鐘工作量）