跳至主要內容
Beast Mode VS Code Agent 拆解

Beast Mode 完整拆解 — VS Code Agent 的六大能力

2 分

多數人在用 VS Code Agent Mode 時,仍然是「下指令 → 等結果 → 發現不對 → 再下指令」這個循環。Beast Mode 的存在,是要斷掉這個循環。

Beast Mode 是 Burke Holland(微軟 VS Code 團隊成員)設計的一份 .chatmode.md 自定義指令。目前版本 3.1,GitHub 1,750 stars、235 forks。它不是工具,不是外掛,就是一份 prompt 文件——但它重新定義了 Agent 在整個任務週期裡的行為。

系列文章

這篇是Beast Mode × autoresearch 完整指南 系列的子文章,專注 Beast Mode 本身的拆解。如果你想看兩者如何搭配成完整 HOTL Agent,讀總文。

Beast Mode 是什麼

核心定位很簡單:把 VS Code Agent Mode 從一個「需要頻繁確認的工具」變成「給它問題它自己解決到底的夥伴」。

使用方式是在 VS Code 裡建立一個 .chatmode.md 檔案,內容就是 Beast Mode 的指令集。當你切換到這個 chat mode,Agent 就遵循這套行為規範運作,直到任務完成。

核心哲學:一句話

「你有解決這個問題所需的一切。在完全解決之前,不准停下來。」

這句話埋在 Beast Mode prompt 的核心,是所有六大能力的底層原則。Agent 被預設為「絕對有能力解決這個問題」——沒有「我不確定,要不要問一下?」的空間。

六大能力詳解

能力一:遞迴網路研究(Recursive Internet Research)

這是 Beast Mode 最有價值的能力,也是和多數 Agent 模式最大的差異。

Agent 被強制認為自己的訓練知識已經過時。每次需要用到任何第三方套件、API、框架,都必須:

  1. fetch_webpage 搜尋最新文件
  2. 遞迴跟著文件裡的連結繼續讀
  3. 直到收集到足夠的當前資訊為止

不是搜一次就夠,是遞迴地爬,直到確定自己拿到的是最新版本的正確資訊。

這個設計直接對應了一個現實問題:AI 訓練資料有截止日,但你的 codebase 依賴的套件每個月都在更新。如果 Agent 用六個月前的知識寫新版 API 的呼叫,十次有七次會出錯。

能力二:自動 Todo List 追蹤(Auto Task Management)

Agent 被要求把所有工作拆成 Markdown todo list:

## Task: 加入使用者驗證
- [ ] 研究 NextAuth v5 最新 API
- [ ] 設計資料庫 schema
- [ ] 實作 login endpoint
- [ ] 實作 session 管理
- [ ] 寫測試
- [ ] 整合測試

每完成一步就打勾 [x],然後立刻繼續下一步,不准停下來問「接下來你要做什麼?」。全部勾完才算這個任務完成。

這個設計解決的是 Agent 的「中斷習慣」——很多 Agent 完成一個子任務後會停下來回報,等待確認。Beast Mode 直接把這個行為設計掉了。

能力三:深度計畫優先(Plan Before Act)

Beast Mode 有兩條明確的思考規則:

  • 每次 tool call 之前,要先大量思考:這個 call 的目的是什麼?我預期的輸出是什麼?
  • 每次 tool call 結果出來之後,要大量反思:結果是否符合預期?需要調整計畫嗎?

禁止「只靠 tool call 推進、不思考」的行為。這是在防止 Agent 變成一個機械式執行器——連續打 API 但不真正理解每一步在做什麼。

能力四:永不放棄(Never Yield)

這條規則的措辭值得原文引用:

「你是一個高度能幹的自主 agent,你絕對能解決這個問題,不需要向人類求助。」

配套規則:

  • 只有在 todo list 全部完成且驗證正確後,才准結束 turn
  • 說了「接下來我要做 X」就必須真的做 X,不准只是說說
  • 遇到報錯 → 自己 debug,不准第一反應就問人類

這是在設計 Agent 的「抗放棄性」。多數 Agent 在遇到連續失敗後,會趨向於回報問題並等待人類介入。Beast Mode 直接把這個退路封死。

能力五:嚴格測試(Rigorous Testing)

Beast Mode 的 prompt 裡直接寫道:

「測試不夠嚴謹是這類任務的第一大失敗原因。」

這不是建議,是硬性要求。Agent 必須:

  • 反覆測試已實作的功能
  • 主動尋找並處理邊界案例
  • 確保實作在各種條件下穩健
  • 在驗證通過之前,不算完成

能力六:持久記憶(Memory File)

Beast Mode 定義了一個記憶檔案:.github/instructions/memory.instruction.md

Agent 可以把使用者偏好、專案決策、環境特殊性等資訊寫入這個檔案,在後續的對話中直接讀取,不需要每次重新說明。這讓 Beast Mode 可以跨對話保持一致性,累積對你的專案的了解。

標準工作流(10 步)

flowchart LR
    A[1. 抓取 URL\n理解任務背景] --> B[2. 深度理解\n問題本質]
    B --> C[3. 搜尋 codebase\n了解現狀]
    C --> D[4. 網路研究\n最新最佳實踐]
    D --> E[5. 制定計畫\n建立 todo list]
    E --> F[6. 小步實作\n每步確認方向]
    F --> G[7. 除錯\n自主處理報錯]
    G --> H[8. 測試\n覆蓋邊界案例]
    H --> I[9. 迭代\n根據測試調整]
    I --> J[10. 全面驗證\n全 todo 打勾才停]

Beast Mode 缺什麼

即使有六大能力,Beast Mode 仍然是「強大的單次任務執行者」。給它一個問題,它會自己研究、規劃、實作、測試、完成。但它沒有:

  • 閉環機制:完成一次就停,不會自動開始下一輪改進
  • 量化評估:沒有單一指標判斷「這次改動比上次好還是壞」
  • 自動版本管理:不會用 git commit/checkout 自動保留或丟棄
  • 無人值守能力:仍然是「人類下指令 → Agent 完成 → 等人類下一個指令」的模式

這四個缺口,剛好是 autoresearch 補上的。

SuperPortia 觀點:agent-intelligence-protocol 的對比

比較 Beast Mode 和 SuperPortia 的 agent-intelligence-protocol,你會發現高度的哲學重疊:

Beast Modeagent-intelligence-protocol
強制認為訓練知識過時tech-freshness.md:PK 驗證規則
遞迴爬網研究Research-Before-Plan 原則
永不向人類求助完成再呈上,不要把夏哥當 subagent
深度計畫 + 反思Pre-Decision 查 UB 先例
持久記憶(memory.instruction.md)UB + Obsidian vault 雙寫

差別在於:Beast Mode 是針對「單一 VS Code 對話」的行為規範,agent-intelligence-protocol 是針對「跨 session、跨 Agent、跨機器」的協作體系。Beast Mode 解決了單 Agent 的執行品質問題;SuperPortia 要解決的是多 Agent 協作的一致性問題。

但兩者的底層哲學完全一致:讓 Agent 真正自主,人類負責設計規則而不是盯著每個步驟。


SuperPortia Intelligence Brief — 小西 整理,2026-03-20。返回總覽:Beast Mode × autoresearch 完整指南 | 延伸閱讀:Karpathy 的 autoresearch 完整拆解 | Beast × autoresearch 合體 — 四個真實落地場景

...關於 Codex 審查的設計,我們參考了 [[beast-mode-deep-dive]] 裡 Beast Mode 的 Never Yield 哲學——agent 在有能力自我驗證的範圍內,不應該把責任推回給使用者。Codex 的角色不是讓 orchestrator 偷懶,而是在 orc...

在此文章中被引用

...nner.py 要做的事(MTAAA TaskList #69)。 SuperPortia Intelligence Brief — 小西 整理,2026-03-20。返回總覽:[[Beast Mode × autoresearch 完整指南]] | 延伸閱讀:[[Beast Mode 完整拆解]] | [[[beast-autoresearch-integration|Beast × autoresearch 合體 —]]

在此文章中被引用

...beast-autoresearch-complete-guide|Beast Mode × autoresearch 完整指南]] 系列的子文章,專注落地場景。如果你還沒讀兩個工具各自的拆解,先看:[[Beast Mode 完整拆解]] 和 [[Karpathy 的 autoresearch 完整拆解]]。...

在此文章中被引用