跳至主要內容

MTAAA Classification Pipeline

In Progress
LangGraph AI Python

概覽

MTAAA(Multi-Tier Agent Autonomous Action Architecture)是將原始 UB 條目晉升為結構化、標記知識的分類引擎。系統從 Cloud UB 的 Dock 拉取 pending 條目,透過 LangGraph 圖式工作流程進行語義分析,再將分類結果寫回正區(classified_entries)。使用 DeepSeek V3 作為主要 LLM,以低成本實現高吞吐分類。

架構

  • text_subgraph — 處理文字類型條目的語義分類子圖,多節點 LangGraph 工作流程
  • boiler_grandpa_v2.py — 批次執行器,每 5 分鐘拉取 Dock pending 條目,觸發分類流程
  • 信心度路由 — 高信心結果自動晉升;低信心結果放入 review queue 等待人工確認
  • 黃金資料集 — 人工標記的評估語料庫,用於追蹤分類模型效能和 prompt 調整成果

技術棧

  • LangGraph — Agent 工作流程圖式編排,支援條件路由和平行節點
  • DeepSeek V3 — 主要分類 LLM,成本效益遠優於 GPT-4
  • Python — Pipeline 核心實作語言
  • Cloud UB API — 讀取 pending 條目,寫回分類結果

目前狀態

In Progress。text_subgraph(I5 Router + I2 text_subgraph)已完成並推送。text_batch_runner.py adapter 是下一個開發重點(Task #69),完成後可清理 Dock 中 102 筆 pending 條目。

與其他專案的關聯

  • Cloud UB — MTAAA 的數據來源與目標:從 Dock 讀取,寫入正區
  • superportia-ub-pipeline — MTAAA 的程式碼 repo,包含所有 Pipeline 邏輯
  • Bridge / Command Center — 分類完成的正區條目透過 UB API 提供給各儀表板
  • EGS 治理框架 — MTAAA 的決策邏輯(ADR、信心度閾值、human-in-the-loop 觸發條件)記錄在 EGS 框架中