動作
Feature #208
已結束
SC
SC
建置完整插管機器人 AI Pipeline:資料增強、模型訓練、導航引導、影片推論與品質驗證
Feature #208:
建置完整插管機器人 AI Pipeline:資料增強、模型訓練、導航引導、影片推論與品質驗證
概述
基於 5-Agent 自動化開發流程(Orchestrator → Data Engineer → Navigation Engineer → Model Architect → Video Pipeline → QA Lead),完成插管機器人視覺辨識系統的全鏈路建置。
1. 資料工程(Data Engineer)¶
- 新增離線資料增強管線
augmentation_pipeline.py(367 行),支援喉鏡影像專用增強(亮度、霧化、旋轉等) - 將訓練集從 33 張擴充至 156 張(
dataset_augmented/) - 新增標註品質檢查工具
label_qa.py(316 行),產出qa_report/視覺化報告 - 新增 5-Fold 交叉驗證
run_crossval.py(213 行)與crossval_folds/資料分割 - 新增外部資料來源文件
data_sources.md、類別分佈統計class_distribution.json
2. 導航工程(Navigation Engineer)¶
- 新增導航模組
navigation.py(300 行):YOLO 偵測結果 → 導航向量(方位角、距離、是否置中) - 新增導航疊圖
navigation_overlay.py(145 行):十字準星、目標標記、方向箭頭繪製 - 整合導航功能至
detect.py:圖片偵測加入導航資訊輸出,影片偵測加入逐幀導航狀態追蹤與 JSON log 匯出 - 新增導航單元測試
test_navigation.py(253 行)
3. 模型架構(Model Architect)¶
- 新增實驗框架
experiments/:含 6 組設定檔(nano/small/medium/cosine/focal/highres) - 新增實驗追蹤器
experiments/experiment_tracker.py、批次執行experiments/run_all_experiments.py - 新增模型匯出工具
experiments/export_model.py(ONNX/TensorRT)與 ensemble 推論experiments/ensemble_inference.py - V3 模型訓練完成(YOLOv11 Small, 100 epochs, GPU):mAP50=0.787, Recall=0.748(較 V2 +30.5%)
- 產出多組訓練實驗結果(
runs/detect/yolo11*)、交叉驗證結果、ONNX 匯出
4. 影片推論管線(Video Pipeline Engineer)¶
- 新增完整影片推論管線
video_pipeline.py(687 行):物件追蹤(ByteTrack/BoT-SORT)、時序平滑(EMA)、導航整合 - 新增追蹤器設定
configs/bytetrack_intubation.yaml、configs/botsort_intubation.yaml - 新增 CLI 入口
run_pipeline.py(122 行) - 新增基準測試
benchmark.py(238 行)與視覺化比較工具visual_qa.py(226 行) - 兩段測試影片處理完成,結果存於
results_v3/(含 pipeline 影片、偵測 CSV、指標 JSON、導航 JSON)
5. 品質驗證(QA Lead)¶
- 新增品質指標框架
qa_metrics.py(385 行):穩定性、導航平滑度、dropout 分析 - 新增整合 QA 執行器
run_qa.py(521 行) - 新增 QA 設定
qa_config.yaml、pytest 設定pytest.ini - 新增測試套件
tests/(6 個測試檔案, 74 tests passed) - QA 報告產出至
qa_results/(JUnit XML、指標 JSON、報告 MD)
6. 專案基礎建設¶
- 新增
CLAUDE.mdAI Agent 團隊設定文件 - 新增 Orchestrator 統籌報告
orchestrator_report.md及各 Agent 報告 - 新增預訓練權重
yolo11m.pt、yolo11s.pt、yolo26n.pt
影響範圍¶
- 新增 Python 檔案 24 個(共約 5,345 行)
- 修改
detect.py(+40 行,整合導航功能) - 新增設定檔、報告、實驗結果、增強資料集等
測試結果¶
- 單元測試:74 passed
- 影片推論:115-175 FPS (RTX 5070 Ti)
- V3 模型 mAP50=0.787, Recall=0.748
- QA 整體:4/5 步驟通過(mAP50 未達 0.80 門檻,建議後續迭代改進)
動作