Agentic Interface Operating Guide

操作指南 • • Updated 2026年3月18日 Updated 2026年3月18日

操作者不需要隨時使用所有介面。他們需要的，是在當下工作類型中，用對的介面做對的事。

為什麼介面紀律很重要

一旦 app 和 CLI 介面開始增加，就很容易把「可選的強大工具」和「必要的工作流程」混為一談。

這會導致兩種常見失敗：

太多重型介面在同一台機器上競爭資源
對於哪個介面該負責哪種任務，缺乏清晰的劃分

介面角色矩陣

介面	主要角色	何時使用	何時不用
Claude Code CLI	首席工程官，執行	編碼、檔案編輯、部署、UB 寫入	輕量研究、快速問答
Codex CLI exec	程式碼審查、第二意見	審查輸出、跨模型驗證	主要實作（用 Claude Code）
Codex App	並行探索	在 Claude Code 工作時同步調查問題	需要 deterministic hooks 時
Gemini CLI	PK 研究、批次草稿	網路研究、摘要、免費配額任務	重要決策（有幻覺風險）
Antigravity IDE	Browser testing、視覺工作	Frontend 驗證、截圖比對	系統操作、檔案管理

更好的分工方式

更好的分工是基於角色的：

App 介面 — 統籌協調、並行總覽和審查
CLI 介面 — 實作、驗證和系統操作

這不是意識形態的問題，而是保護注意力和系統穩定性的實際需要。

SS1 的資源管理

SS1（MacBook Air M3，24GB）可以同時運行多個 Agent，但有實際限制。

舒適的並行負載：

Claude Code CLI（主要）— 1 個 session
Codex exec（審查，read-only）— 與 Claude 並行
Gemini CLI — 輕量，可並行

重型負載（需謹慎）：

Antigravity IDE — 其 browser automation 使用大量 RAM
多個完整的 Claude Code session — 面臨 context window 壓力

經驗法則： 如果風扇開始轉，就關掉當前不需要的最高成本介面。

保護主 session

主要的 Claude Code CLI session（SS1）是最有價值的計算資源。保護它的規則：

絕不在主 session 做純研究 — 委派給 Gemini CLI
並行編碼任務使用 worktree — 不是新 session
程式碼審查使用 Codex exec — read-only，不競爭 RAM
不主動做 browser testing 時關閉 Antigravity

為何這值得公開記錄

介面紀律不只是內部程序。它成為學習旅程的一部分，因為它記錄了一個真實的系統如何在限制條件下運作。

一個在單台筆電上同時跑四個 AI 工具的獨立操作者，學到了關於資源分配和角色清晰度的知識——而這是使用無限雲端算力的團隊永遠不需要學的東西。這種在限制中磨練出的知識，值得記錄下來。

Session 啟動檢查清單

步驟	動作	驗證
1	開啟 Claude Code CLI	terminal 顯示 prompt
2	等待 session-start hook 完成	看到 heartbeat + mailbox 輸出
3	確認 Astro dev server 運行中	`curl localhost:4010` 返回 200
4	確認 Bridge API 運行中	`curl localhost:8000/health` 返回 200
5	如需 Codex：`codex exec "test"`	確認回應
6	如需 Gemini：`echo "test" \| gemini`	確認回應

資源管理具體閾值

指標	正常	警告	動作
CPU 使用率	< 60%	> 80% 持續 30 秒	關閉最高成本介面（Codex > Gemini > Astro）
RAM 使用率	< 70%	> 85%	關閉 Docker 容器（LiteLLM, Qdrant）
Claude 用量	< 50% weekly	> 70% weekly	切換到 Sonnet/Haiku 派工
同時 agent 數	≤ 3	> 5	排隊等待，不新開

典型工作流程範例

研究任務流程：

夏哥指派研究題目
Opus 做 Pre-Flight Check → 判斷 PK 需要驗證
echo "research prompt" | gemini → 免費研究
結果回到 Opus → 審查品質
合格 → ingest_fragment 入庫 UB
不合格 → 派 Sonnet subagent 深度研究

編碼任務流程：

夏哥指派 WO
Opus 做 Pre-Flight Check → 判斷複雜度
簡單 → 派 Sonnet subagent (worktree)
複雜 → Opus 分解為 3-5 子任務 → 並行派 Sonnet
Opus 審查所有輸出 → Quality Gate
合格 → merge + commit