# Ch1 練習題：Deep Research 與 RAG

> 概念 2 題＋實作 2 題。詳解在最後。

## 題目

**Q1（cosine 手算）** 兩個迷你「向量」：a = (2, 1, 0)、b = (1, 2, 0)。
(a) 算 cos θ。
(b) 把 b 改成 (2, 4, 0)（內容相同但「字數加倍」），cos θ 變多少？這說明 cosine 的什麼性質、對檢索為什麼重要？

**Q2（chunk 設計）** 你要把一篇 12,000 字的 review 放進知識庫。比較兩種設定：A：chunk 4000 字、overlap 0；B：chunk 800 字、overlap 150。
(a) 各切出幾塊？
(b) 對「查一個特定實驗條件」這種問題，哪個設定檢索比較準？為什麼？
(c) overlap 防的是什麼具體事故？

**Q3（引用抽查協議）** 為實驗室設計一個「AI 引用抽查協議」：抽查比例、誰查、查什麼（至少三個檢查點）、不一致時怎麼記錄。寫成可以貼在 wiki 的半頁。

**Q4（對照實驗）** 把同一個問題「ΔG_H ≈ 0 為什麼是 HER 的活性指標？」分別丟給 (a) 一般 chatbot、(b) deep research 工具（或用 `interactive/rag-pipeline.html` 的迷你版體會流程）。記錄：引用數、可驗證的引用數、答案中無出處的關鍵句數。寫 5 句結論。

---

## 詳解

**A1**
(a) a·b = 2+2+0 = 4；‖a‖ = ‖b‖ = √5；cos θ = 4/5 = **0.8**。
(b) b' = (2,4,0)：a·b' = 8；‖b'‖ = 2√5；cos θ = 8/(√5·2√5) = 8/10 = **0.8，不變**。
cosine 只看方向不看長度——**長文件不會因為字多就佔便宜**，檢索比的是「主題方向」。

**A2**
(a) A：3 塊；B：stride = 800−150 = 650，約 (12000−800)/650 + 1 ≈ **19 塊**。
(b) B 較準。4000 字的塊裡，目標句被大量無關文字稀釋，向量「主題方向」變模糊；800 字的塊主題集中，cosine 對得上。
(c) overlap 防「關鍵句恰好被切在兩塊邊界」——一句話的前半在塊 i、後半在塊 i+1，兩塊都檢索不到完整語意。

**A3** 參考要點（合理即可）：
- 比例：進論文的引用 **100% 查**；組會簡報抽 1/3。
- 誰查：引用該句的人自己查（責任綁定）。
- 檢查點：① 來源存在（DOI 解析得開）② 來源真的支持那句話（不是只「相關」）③ 數字與單位一致（eV vs kcal/mol 是經典翻車點）。
- 記錄：wiki 開一頁「AI 引用抽查 log」，記日期/句子/來源/裁定（支持/部分/不支持）。

**A4** 預期觀察：chatbot 的引用常「看起來像真的」但 DOI 失效或內容對不上；deep research 的引用可驗證率高很多，但**解讀仍可能過度概括**。結論方向：兩者差的不是「會不會寫」，是「有沒有檢索基礎」；以及無論哪種，抽查都是你的責任。
