訓練資料籌備規劃
首先向您介紹目前規劃的完整流程:
我們的照片統一採用「高畫質」、「比例 4:3」的規則進行拍攝,並依「名稱」與「正反面」建立資料夾。
接著,我們會依照資料夾,逐一核對陳主任提供的藥物清單,確保最後所有藥物都有建立圖庫。
使用高畫質拍攝的好處是:之後如果需要高清晰的照片,就不必再重拍;壞處是在進行深度學習的 Training 時,如果送入的照片畫質太高,光是靠 YOLO 內建的 Re-Size 就會花費很多時間(像之前訓練了三天才 13,000 次 Iteration,時間都花在 YOLO 的 Re-Size 而不是訓練)。
為了解決這個問題,我們會在所有藥品拍攝完畢後(即藥櫃上所有的藥品),先將所有照片複製一份,然後使用 Python 程式將所有複製的照片先進行 Re-Size,調整為高度 448px 的尺寸。(使用 Python 調整照片尺寸會比 YOLO 快非常非常多!)
接下來,我與威佑會先將 Re-Size 的照片重新依照數字進行命名(使用快速命名的程式),以方便學弟們進行後續的 Cropping。
最後我們會召集學弟,進行環境建置與 Cropping 教學,然後分配圖庫。
資料庫 Cropping、Label 建立完成後,即可送入 YOLO 中訓練。以縮減尺寸的照片訓練,只需要幾天就能跑完所有藥品的 40,000 次 Iteration。(若送入原尺寸照片,可能需要數個禮拜)
這兩週的任務:
我們會將上方的步驟 1 與 2 完成,即藥品的拍攝與核對工作。
接這便可開始進行步驟 3 之後的資料後處理與人工作業。
另一方面,我會找時間將實驗室目前擁有的 21 種藥品照片做 Cropping,用以評估目前訓練的「最陽春辨識系統」的辨識效果。