專案

一般

配置概況

動作

Feature #208

已結束
SC SC

建置完整插管機器人 AI Pipeline:資料增強、模型訓練、導航引導、影片推論與品質驗證

Feature #208: 建置完整插管機器人 AI Pipeline:資料增強、模型訓練、導航引導、影片推論與品質驗證

是由 Sashiba Chou約 2 個月 前加入. 於 約 2 個月 前更新.

狀態:
Closed
優先權:
Normal
被分派者:
開始日期:
2026-04-11
完成日期:
2026-04-11
完成比例:

100%

預估工時:
1:00 小時
耗用工時:

概述

基於 5-Agent 自動化開發流程(Orchestrator → Data Engineer → Navigation Engineer → Model Architect → Video Pipeline → QA Lead),完成插管機器人視覺辨識系統的全鏈路建置。

1. 資料工程(Data Engineer)

  • 新增離線資料增強管線 augmentation_pipeline.py(367 行),支援喉鏡影像專用增強(亮度、霧化、旋轉等)
  • 將訓練集從 33 張擴充至 156 張(dataset_augmented/
  • 新增標註品質檢查工具 label_qa.py(316 行),產出 qa_report/ 視覺化報告
  • 新增 5-Fold 交叉驗證 run_crossval.py(213 行)與 crossval_folds/ 資料分割
  • 新增外部資料來源文件 data_sources.md、類別分佈統計 class_distribution.json

2. 導航工程(Navigation Engineer)

  • 新增導航模組 navigation.py(300 行):YOLO 偵測結果 → 導航向量(方位角、距離、是否置中)
  • 新增導航疊圖 navigation_overlay.py(145 行):十字準星、目標標記、方向箭頭繪製
  • 整合導航功能至 detect.py:圖片偵測加入導航資訊輸出,影片偵測加入逐幀導航狀態追蹤與 JSON log 匯出
  • 新增導航單元測試 test_navigation.py(253 行)

3. 模型架構(Model Architect)

  • 新增實驗框架 experiments/:含 6 組設定檔(nano/small/medium/cosine/focal/highres)
  • 新增實驗追蹤器 experiments/experiment_tracker.py、批次執行 experiments/run_all_experiments.py
  • 新增模型匯出工具 experiments/export_model.py(ONNX/TensorRT)與 ensemble 推論 experiments/ensemble_inference.py
  • V3 模型訓練完成(YOLOv11 Small, 100 epochs, GPU):mAP50=0.787, Recall=0.748(較 V2 +30.5%)
  • 產出多組訓練實驗結果(runs/detect/yolo11*)、交叉驗證結果、ONNX 匯出

4. 影片推論管線(Video Pipeline Engineer)

  • 新增完整影片推論管線 video_pipeline.py(687 行):物件追蹤(ByteTrack/BoT-SORT)、時序平滑(EMA)、導航整合
  • 新增追蹤器設定 configs/bytetrack_intubation.yamlconfigs/botsort_intubation.yaml
  • 新增 CLI 入口 run_pipeline.py(122 行)
  • 新增基準測試 benchmark.py(238 行)與視覺化比較工具 visual_qa.py(226 行)
  • 兩段測試影片處理完成,結果存於 results_v3/(含 pipeline 影片、偵測 CSV、指標 JSON、導航 JSON)

5. 品質驗證(QA Lead)

  • 新增品質指標框架 qa_metrics.py(385 行):穩定性、導航平滑度、dropout 分析
  • 新增整合 QA 執行器 run_qa.py(521 行)
  • 新增 QA 設定 qa_config.yaml、pytest 設定 pytest.ini
  • 新增測試套件 tests/(6 個測試檔案, 74 tests passed)
  • QA 報告產出至 qa_results/(JUnit XML、指標 JSON、報告 MD)

6. 專案基礎建設

  • 新增 CLAUDE.md AI Agent 團隊設定文件
  • 新增 Orchestrator 統籌報告 orchestrator_report.md 及各 Agent 報告
  • 新增預訓練權重 yolo11m.ptyolo11s.ptyolo26n.pt

影響範圍

  • 新增 Python 檔案 24 個(共約 5,345 行)
  • 修改 detect.py(+40 行,整合導航功能)
  • 新增設定檔、報告、實驗結果、增強資料集等

測試結果

  • 單元測試:74 passed
  • 影片推論:115-175 FPS (RTX 5070 Ti)
  • V3 模型 mAP50=0.787, Recall=0.748
  • QA 整體:4/5 步驟通過(mAP50 未達 0.80 門檻,建議後續迭代改進)
動作

匯出至 PDF Atom