Beast Mode 完整拆解 — VS Code Agent 的六大能力
多數人在用 VS Code Agent Mode 時,仍然是「下指令 → 等結果 → 發現不對 → 再下指令」這個循環。Beast Mode 的存在,是要斷掉這個循環。
Beast Mode 是 Burke Holland(微軟 VS Code 團隊成員)設計的一份 .chatmode.md 自定義指令。目前版本 3.1,GitHub 1,750 stars、235 forks。它不是工具,不是外掛,就是一份 prompt 文件——但它重新定義了 Agent 在整個任務週期裡的行為。
這篇是Beast Mode × autoresearch 完整指南 系列的子文章,專注 Beast Mode 本身的拆解。如果你想看兩者如何搭配成完整 HOTL Agent,讀總文。
Beast Mode 是什麼
核心定位很簡單:把 VS Code Agent Mode 從一個「需要頻繁確認的工具」變成「給它問題它自己解決到底的夥伴」。
使用方式是在 VS Code 裡建立一個 .chatmode.md 檔案,內容就是 Beast Mode 的指令集。當你切換到這個 chat mode,Agent 就遵循這套行為規範運作,直到任務完成。
核心哲學:一句話
「你有解決這個問題所需的一切。在完全解決之前,不准停下來。」
這句話埋在 Beast Mode prompt 的核心,是所有六大能力的底層原則。Agent 被預設為「絕對有能力解決這個問題」——沒有「我不確定,要不要問一下?」的空間。
六大能力詳解
能力一:遞迴網路研究(Recursive Internet Research)
這是 Beast Mode 最有價值的能力,也是和多數 Agent 模式最大的差異。
Agent 被強制認為自己的訓練知識已經過時。每次需要用到任何第三方套件、API、框架,都必須:
- 用
fetch_webpage搜尋最新文件 - 遞迴跟著文件裡的連結繼續讀
- 直到收集到足夠的當前資訊為止
不是搜一次就夠,是遞迴地爬,直到確定自己拿到的是最新版本的正確資訊。
這個設計直接對應了一個現實問題:AI 訓練資料有截止日,但你的 codebase 依賴的套件每個月都在更新。如果 Agent 用六個月前的知識寫新版 API 的呼叫,十次有七次會出錯。
能力二:自動 Todo List 追蹤(Auto Task Management)
Agent 被要求把所有工作拆成 Markdown todo list:
## Task: 加入使用者驗證
- [ ] 研究 NextAuth v5 最新 API
- [ ] 設計資料庫 schema
- [ ] 實作 login endpoint
- [ ] 實作 session 管理
- [ ] 寫測試
- [ ] 整合測試
每完成一步就打勾 [x],然後立刻繼續下一步,不准停下來問「接下來你要做什麼?」。全部勾完才算這個任務完成。
這個設計解決的是 Agent 的「中斷習慣」——很多 Agent 完成一個子任務後會停下來回報,等待確認。Beast Mode 直接把這個行為設計掉了。
能力三:深度計畫優先(Plan Before Act)
Beast Mode 有兩條明確的思考規則:
- 每次 tool call 之前,要先大量思考:這個 call 的目的是什麼?我預期的輸出是什麼?
- 每次 tool call 結果出來之後,要大量反思:結果是否符合預期?需要調整計畫嗎?
禁止「只靠 tool call 推進、不思考」的行為。這是在防止 Agent 變成一個機械式執行器——連續打 API 但不真正理解每一步在做什麼。
能力四:永不放棄(Never Yield)
這條規則的措辭值得原文引用:
「你是一個高度能幹的自主 agent,你絕對能解決這個問題,不需要向人類求助。」
配套規則:
- 只有在 todo list 全部完成且驗證正確後,才准結束 turn
- 說了「接下來我要做 X」就必須真的做 X,不准只是說說
- 遇到報錯 → 自己 debug,不准第一反應就問人類
這是在設計 Agent 的「抗放棄性」。多數 Agent 在遇到連續失敗後,會趨向於回報問題並等待人類介入。Beast Mode 直接把這個退路封死。
能力五:嚴格測試(Rigorous Testing)
Beast Mode 的 prompt 裡直接寫道:
「測試不夠嚴謹是這類任務的第一大失敗原因。」
這不是建議,是硬性要求。Agent 必須:
- 反覆測試已實作的功能
- 主動尋找並處理邊界案例
- 確保實作在各種條件下穩健
- 在驗證通過之前,不算完成
能力六:持久記憶(Memory File)
Beast Mode 定義了一個記憶檔案:.github/instructions/memory.instruction.md。
Agent 可以把使用者偏好、專案決策、環境特殊性等資訊寫入這個檔案,在後續的對話中直接讀取,不需要每次重新說明。這讓 Beast Mode 可以跨對話保持一致性,累積對你的專案的了解。
標準工作流(10 步)
flowchart LR
A[1. 抓取 URL\n理解任務背景] --> B[2. 深度理解\n問題本質]
B --> C[3. 搜尋 codebase\n了解現狀]
C --> D[4. 網路研究\n最新最佳實踐]
D --> E[5. 制定計畫\n建立 todo list]
E --> F[6. 小步實作\n每步確認方向]
F --> G[7. 除錯\n自主處理報錯]
G --> H[8. 測試\n覆蓋邊界案例]
H --> I[9. 迭代\n根據測試調整]
I --> J[10. 全面驗證\n全 todo 打勾才停]
Beast Mode 缺什麼
即使有六大能力,Beast Mode 仍然是「強大的單次任務執行者」。給它一個問題,它會自己研究、規劃、實作、測試、完成。但它沒有:
- 閉環機制:完成一次就停,不會自動開始下一輪改進
- 量化評估:沒有單一指標判斷「這次改動比上次好還是壞」
- 自動版本管理:不會用 git commit/checkout 自動保留或丟棄
- 無人值守能力:仍然是「人類下指令 → Agent 完成 → 等人類下一個指令」的模式
這四個缺口,剛好是 autoresearch 補上的。
SuperPortia 觀點:agent-intelligence-protocol 的對比
比較 Beast Mode 和 SuperPortia 的 agent-intelligence-protocol,你會發現高度的哲學重疊:
| Beast Mode | agent-intelligence-protocol |
|---|---|
| 強制認為訓練知識過時 | tech-freshness.md:PK 驗證規則 |
| 遞迴爬網研究 | Research-Before-Plan 原則 |
| 永不向人類求助 | 完成再呈上,不要把夏哥當 subagent |
| 深度計畫 + 反思 | Pre-Decision 查 UB 先例 |
| 持久記憶(memory.instruction.md) | UB + Obsidian vault 雙寫 |
差別在於:Beast Mode 是針對「單一 VS Code 對話」的行為規範,agent-intelligence-protocol 是針對「跨 session、跨 Agent、跨機器」的協作體系。Beast Mode 解決了單 Agent 的執行品質問題;SuperPortia 要解決的是多 Agent 協作的一致性問題。
但兩者的底層哲學完全一致:讓 Agent 真正自主,人類負責設計規則而不是盯著每個步驟。
SuperPortia Intelligence Brief — 小西 整理,2026-03-20。返回總覽:Beast Mode × autoresearch 完整指南 | 延伸閱讀:Karpathy 的 autoresearch 完整拆解 | Beast × autoresearch 合體 — 四個真實落地場景
...關於 Codex 審查的設計,我們參考了 [[beast-mode-deep-dive]] 裡 Beast Mode 的 Never Yield 哲學——agent 在有能力自我驗證的範圍內,不應該把責任推回給使用者。Codex 的角色不是讓 orchestrator 偷懶,而是在 orc...
...nner.py 要做的事(MTAAA TaskList #69)。 SuperPortia Intelligence Brief — 小西 整理,2026-03-20。返回總覽:[[Beast Mode × autoresearch 完整指南]] | 延伸閱讀:[[Beast Mode 完整拆解]] | [[[beast-autoresearch-integration|Beast × autoresearch 合體 —]]
...-- 延伸閱讀: - [[Beast Mode × autoresearch 完整指南]] — 兩個方法論的深度解析 - [[Beast Mode 深度拆解]] — VS Code Agent 的六大能力逐條解析 -...
...解法——而合在一起,就是 SuperPortia HOTL 架構一直在往那個方向走的完整藍圖。 本文是系列總覽 這是四篇系列文的 Hub 文章。要深入了解各個面向: - [[Beast Mode 完整拆解]] — VS Code Agent 的六大能力逐條解析 -...
...beast-autoresearch-complete-guide|Beast Mode × autoresearch 完整指南]] 系列的子文章,專注落地場景。如果你還沒讀兩個工具各自的拆解,先看:[[Beast Mode 完整拆解]] 和 [[Karpathy 的 autoresearch 完整拆解]]。...