Agent Capability Upgrade Plan

Agentic 不能只是一個模型 session 的薄層包裝。它必須成為一套學習、執行、審查、長期寫作的作業系統。

這份升級計畫從一個簡單的事實出發：工具的替換速度比工作流程快得多。如果工作流程不穩定，加入更多模型只會製造更多噪音。

什麼必須成為持久的結構

第一層是存取對等（access parity）。Claude Code 和 Codex 都需要足夠的存取權限，能夠操作、驗證和審查，而不需要讓任何一個工具成為系統的永久擁有者。

第二層是治理對等（governance parity）。一個工具更多但邊界更弱的模型，並不會更安全。操作規則、驗證紀律、升級路徑，必須由所有 Agent 共享。

第三層是執行對等（execution parity）。某個 Agent 在某些介面上仍然可能更有優勢，但每個 Agent 都應該能夠從診斷到實作到驗證，獨立完成一個任務。

近期的形態不是一群 Agent 的集合，而是一個小型、可審查的團隊：

這讓系統對於單人操作者而言保持可理解，同時仍允許真正的並行作業。

目標：Claude Code 和 Codex 都對所有 repo 有讀取權限，並對各自分配的 worktree 有寫入權限。

目標：所有 Agent 載入相同的 EGS 規則。沒有任何 Agent 享有其他 Agent 無法審計的特權行為。

需要在所有 Agent 間套用的關鍵控制：

目標：任何 Agent 都能接下一個 WO、實作、驗證，並完整交接。

任何實作的驗收標準：

讓操作更安全的結構，同樣能讓未來的寫作更好。當一個計畫、修正、決策或失敗模式被清晰記錄，它之後就能成為 blog 文章的原始素材，而不是消失在 chat 歷史中。

這才是升級的真正意義：不是為了自動化而自動化，而是建立一個能夠複利增長的學習系統。

工具	UB 讀	UB 寫	Vault 讀	Vault 寫	Git	Deploy	MCP
Claude Code CLI (SS1)	✅	✅	✅	✅	✅	✅ (gate)	✅
Claude Code CLI (SS2)	✅	✅	✅	✅	✅	—	✅
Codex CLI	✅	❌	✅	❌	✅ (read-only sandbox)	❌	✅
Gemini CLI	✅	❌	❌	❌	❌	❌	✅
Sonnet subagent	✅	✅	✅	✅	✅	—	✅
Haiku subagent	✅	✅	✅	✅	✅	—	✅

階段	驗收條件	驗證方式
Phase 1	所有工具都能讀 UB + Vault	`search_brain` + `obsidian search` 測試
Phase 2	deterministic coverage > 60%	`verify-daily-cycle.sh` 評分
Phase 3	任一 agent 可獨立完成 WO 全流程	端到端測試：建 WO → 實作 → 提交 → 驗證