tft每日頭條

 > 科技

 > 圖像标注的操作過程

圖像标注的操作過程

科技 更新时间:2024-12-19 09:13:48

我們知道在深度學習中,大家做得最多的工作就是數據處理,數據處理的過程占據了整個産品生命周期的大部分時間,因此如何高效的進行數據處理,是縮短産品周期的關鍵。

為了保證一個算法的不斷優化,我們往往在訓練完一個模型之後,需要進行模型的不斷叠代,叠代過程中,我們需要将識别錯誤的樣本挑選出來并進行二次标注。對于一個小的算法團隊來說,标注增加了用人成本,小批量的數據交給外包反而不太合适。因此這裡二次開發labelimg,形成了一個自動标注系統。

什麼時候需要自動标注

自動标注需要我們實現一個訓練好的模型。這個模型能夠幫助我們識别實際中出現的情況,比如檢測算法,此模型應當能夠識别大部分數據,對于少部分識别不了的,識别錯誤的,需要人工手動确認。

就是之前我所寫文章中出現的黑色頭發和黑色帽子的識别例子。我們需要将識别錯誤的、未識别的數據列舉出來,然後投入到數據集中進行再次訓練。

這樣我們能夠簡單确認目标有沒有被正确框中,對于沒有框中的少部分數據進行二次标注。當然,為了保證準确性,這裡檢測的阈值應該設置相對較高。

修改labelimg

這裡我們以yolov5訓練并轉換成onnx的模型為例,介紹一些細節。

圖像标注的操作過程(基于labelimg的自動标注系統)1

讀取圖片

我們查看代碼可以知道,labelimg打開文件之後,直接讀取下一張圖片并進行展示,并且其邏輯是:先導入圖片,然後在文件下找是否存在該标注文件,然後導入标注文件。因此我們隻需要在導入每一張圖片後直接保存識别結果就可以了。這裡修改了默認,讓圖片和标注文件在同一個文件夾下。

保存的邏輯很簡單,就是利用xml.etree.ElementTree根據标注的xml結構進行添加并保存即可。這裡不再贅述。

圖像标注的操作過程(基于labelimg的自動标注系統)2

保存xml

效果

圖像标注的操作過程(基于labelimg的自動标注系統)3

識别效果

自動标注系統完成之後,就不用腳本先生成标注框,然後打開labelimg一個一個地去确認是否标注正确了,直接當場确認,效率提高了一些。

後續将在界面上修改,添加更多檢測框架,一鍵導入模型。

今天嘗試頭條代碼塊發現居然不能使用,真是醉了。

本文完

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved