訓練資料籌備規劃

首先向您介紹目前規劃的完整流程:

  1. 我們的照片統一採用「高畫質」、「比例 4:3」的規則進行拍攝,並依「名稱」與「正反面」建立資料夾。

  2. 接著,我們會依照資料夾,逐一核對陳主任提供的藥物清單,確保最後所有藥物都有建立圖庫。

  3. 使用高畫質拍攝的好處是:之後如果需要高清晰的照片,就不必再重拍;壞處是在進行深度學習的 Training 時,如果送入的照片畫質太高,光是靠 YOLO 內建的 Re-Size 就會花費很多時間(像之前訓練了三天才 13,000 次 Iteration,時間都花在 YOLO 的 Re-Size 而不是訓練)。

  4. 為了解決這個問題,我們會在所有藥品拍攝完畢後(即藥櫃上所有的藥品),先將所有照片複製一份,然後使用 Python 程式將所有複製的照片先進行 Re-Size,調整為高度 448px 的尺寸。(使用 Python 調整照片尺寸會比 YOLO 快非常非常多!)

  5. 接下來,我與威佑會先將 Re-Size 的照片重新依照數字進行命名(使用快速命名的程式),以方便學弟們進行後續的 Cropping。

  6. 最後我們會召集學弟,進行環境建置與 Cropping 教學,然後分配圖庫。

  7. 資料庫 Cropping、Label 建立完成後,即可送入 YOLO 中訓練。以縮減尺寸的照片訓練,只需要幾天就能跑完所有藥品的 40,000 次 Iteration。(若送入原尺寸照片,可能需要數個禮拜)

這兩週的任務:

  • 我們會將上方的步驟 1 與 2 完成,即藥品的拍攝與核對工作。

  • 接這便可開始進行步驟 3 之後的資料後處理與人工作業。

  • 另一方面,我會找時間將實驗室目前擁有的 21 種藥品照片做 Cropping,用以評估目前訓練的「最陽春辨識系統」的辨識效果。

results matching ""

    No results matching ""