MTAAA Classification Pipeline
• In Progress
LangGraph AI Python
概覽
MTAAA(Multi-Tier Agent Autonomous Action Architecture)是將原始 UB 條目晉升為結構化、標記知識的分類引擎。系統從 Cloud UB 的 Dock 拉取 pending 條目,透過 LangGraph 圖式工作流程進行語義分析,再將分類結果寫回正區(classified_entries)。使用 DeepSeek V3 作為主要 LLM,以低成本實現高吞吐分類。
架構
- text_subgraph — 處理文字類型條目的語義分類子圖,多節點 LangGraph 工作流程
- boiler_grandpa_v2.py — 批次執行器,每 5 分鐘拉取 Dock pending 條目,觸發分類流程
- 信心度路由 — 高信心結果自動晉升;低信心結果放入 review queue 等待人工確認
- 黃金資料集 — 人工標記的評估語料庫,用於追蹤分類模型效能和 prompt 調整成果
技術棧
- LangGraph — Agent 工作流程圖式編排,支援條件路由和平行節點
- DeepSeek V3 — 主要分類 LLM,成本效益遠優於 GPT-4
- Python — Pipeline 核心實作語言
- Cloud UB API — 讀取 pending 條目,寫回分類結果
目前狀態
In Progress。text_subgraph(I5 Router + I2 text_subgraph)已完成並推送。text_batch_runner.py adapter 是下一個開發重點(Task #69),完成後可清理 Dock 中 102 筆 pending 條目。
與其他專案的關聯
- Cloud UB — MTAAA 的數據來源與目標:從 Dock 讀取,寫入正區
- superportia-ub-pipeline — MTAAA 的程式碼 repo,包含所有 Pipeline 邏輯
- Bridge / Command Center — 分類完成的正區條目透過 UB API 提供給各儀表板
- EGS 治理框架 — MTAAA 的決策邏輯(ADR、信心度閾值、human-in-the-loop 觸發條件)記錄在 EGS 框架中