動作
Feature #206
已結束
SC
SC
參考資料與早期實驗
Feature #206:
參考資料與早期實驗
概述
目的¶
將專案早期聲帶偵測實驗程式碼納入版本控制,並整理外部參考資料的來源連結,確保專案的技術演進過程可追溯。
工作項目¶
1. 建立 vocal_detection/ 目錄,放入早期聲帶偵測實驗¶
-
vocal_detector.py:基於舊版模型nano93.pt的單張圖片聲帶偵測腳本。該實驗使用與目前主流程不同的類別定義:- Class 0: glottic slit(聲門裂)
- Class 2: left vocal fold(左聲帶)
- Class 4: right vocal fold(右聲帶)
-
vocal_detector_vid.py:對應的影片偵測版本,逐幀處理影片並輸出標註結果 - 此實驗為專案早期探索階段的產物,驗證了 YOLO 應用於喉鏡影像偵測的可行性。後續因偵測目標調整(從聲帶結構改為插管輔助結構:arytenoid_cartilage / epiglottis / larynx)與模型更新(從
nano93.pt改為yolo11n.pt),該實驗已被主流程取代
2. 在 .gitignore 中排除大型二進位檔案¶
將 reference/ 與 bakalarka/ 目錄排除於版本控制之外,避免 zip、PDF、DOCX、PPTX 等大型二進位檔案佔用 repo 空間。
外部參考資料(連結)¶
- 原始捷克學士論文 repo:Bachelor_thesis by Jingr33
- Roboflow 資料集:laryngoscope-labeling v2 (CC BY 4.0 授權)
附件(手動上傳)¶
-
Bachelor_thesis-master.zip:學士論文完整 repo 壓縮檔 -
laryngoscope-labeling.v2i.yolov11.zip:Roboflow 原始資料集匯出檔 -
bakalarka.pdf:學士論文全文(捷克語) -
BP_obhajoba.pdf:論文答辯簡報
驗收條件¶
-
vocal_detection/目錄已建立並包含vocal_detector.py與vocal_detector_vid.py -
.gitignore已排除reference/與bakalarka/目錄 - 上述附件已上傳至本 ticket
- 已提交至版本控制
備註¶
-
vocal_detection/的腳本依賴nano93.pt模型權重(未納入版控),無法直接執行,僅作為實驗記錄保留
動作