提及數據标注,大多數人第一反應就是圖像标注。圖像标注在人工智能與各行各業的應用簡相結合的研究過程中扮演着重要的角色,通過對路況的圖片中的汽車和行人進行篩選分類标框等,可以提高安防攝像頭以及無人駕駛的識别能力
如圖所示,通過對醫療影像中的骨骼進行描點,特别是對病理切片進行标注分析,能夠幫助AI提前預測各種疾病
什麼是圖像數據标注
圖像标注是一個将标簽添加到圖像上的過程。其目标範圍既可以是在整個圖像上僅使用一個标簽,也可以是在某個圖像内的各組像素中配上多個标簽
一個簡單的例子是∶我們在向幼兒提供各種動物的電子圖像時,可以通過将正确的動物名稱标記到每個圖像上,以方便幼兒在點觸圖像時能夠獲悉其名稱
當然,具體标注的方法取決于實際項目所使用到的圖像标注類型。有時候,我們可以将那些通過地圖APP采集的地面實況數據(ground truth data),作為帶标注的圖像,饋入計算機視覺的對應算法。通過反複訓練,模型便可以将已标注的實體與那些未标注的圖像區分開來
圖像數據标注的類型
每個數據科學任務都需要數據。具體地說,是輸入系統的幹淨易懂的數據
圖像标注在計算機視覺中起着至關重要的作用。圖像标的目标是為和任務相關的、特定于任務的标簽。這可能包括基于文本的标簽(類),繪制在圖像上的标簽(即邊框),甚至是像素級的标簽。下來我們一起看看常用到的一些圖像标注類型
01
拉框
用2D、3D、多邊形框等标注出圖像中的制定目标對象
02
語義分割
标記圖像中存在的内容及位置,根據屬性進行像素級分割,支持單屬性、多級屬性
03
實例分割
實例分割是圖像分割的一種子類型,它在像素級别上标識圖像中每個物體的每個實例。實例分割和語義分割是圖像分割的兩種粒度級别之一
04
目标檢測
支持人物ID追蹤、視頻軌迹追蹤,截取視頻關鍵幀,對連續畫面中出現的同一目标标注相同的id,從而記錄目标軌迹的變化
05
圖像分類
圖像分類不同于目标檢測。目标檢測的目的是識别和定位目标,而圖像分類的目的是目标屬性,對圖像劃分到不同分類
這個用例的一個常見示例是對貓和狗的圖片進行分類。标注者必須為一隻狗的圖像分配一個類标簽"dog",對貓的圖像分配類标簽"cat"
06
關鍵點
在許多計算機視覺應用中,神經網絡常常需要識别輸入圖像中重要的感興趣的點。我們把這些點稱為地标或關鍵點。例如:可對人臉關鍵點、人體骨骼關鍵點、人臉五官等進行關鍵點标注
07
線段标注
支持貝塞爾曲線和普通線段标注,支持對車道線進行貝塞爾曲線标注,使用線段将圖像目标的邊緣、輪廓用線段标注
08
ocr轉寫
OCR轉寫是對圖像中的文字内容進行标記與轉寫,幫助訓練和完善圖片與文本識别模型
09
點雲标注
點雲是三維數據的一種重要表達方式,通過激光雷達等傳感器,能夠采集到各類障礙物以及其位置坐标,而标注員則需要将這些密集的點雲分類,并标注上不同屬性,常應用于自動駕駛領域
10
屬性判斷
屬性判别是指通過人工或機器配合的方式,識别出圖像中的目标物體,并将其标注上對應屬性
圖像數據标注的應用
01
醫學
多邊形可用于在醫用x射線中标記器官,以便将它們輸入深度學習模型,以訓練x 射線中的畸形或缺陷,這是圖像标注最重要的應用之一。
在醫療行業應用較多的則是影像标注,影像标注與車輛的拉框标注所采用的方法比較類似,但是處理起來會涉及較為嚴謹的專業醫學知識,再加之對标注準确性的要求極高,如果标注錯誤會産生非常嚴重的醫療事故,這就是要求隻能一些醫學領域的專業人才來做,比如在職醫生和醫學院研究生。而面對一些比較複雜的醫療影像,甚至一些在三甲醫院實習的研究生都無法完成
02
零售
2D邊框可以用于标注産品的圖像,然後機器學習算法可以使用這些圖像來預測成本和其他屬性。圖像分類在這方面也有幫助
03
自動駕駛汽車
這是另一個重要的領域,圖像标注可以應用。利用語義分割對圖像中的每個像素進行标記,使車輛能夠感知到道路上的障礙物。這一領域的研究仍在進行中
04
情緒檢測
這是裡程碑,可以用來檢測一個人的情緒(高興,悲傷,或自然)。這可以應用于評估受試者對特定内容的情緒反應
05
制造行業
線和樣條可用于标注工廠的圖像線跟随機器人工作。這可以幫助自動化生産過程,人力勞動可以最小化
寫在最後的話
如今,世界正在經曆一場影響範圍甚廣的技術革命,信息技術(IT)正快速決定着一切事物的發展進度和計劃。
機器學習和人工智能依靠計算算法複制人類的智能行為,包括自動語音識别、增強現實和神經網絡機器翻譯。這些不同領域技術創新的成功問世促進了人們對計算機可視化和解釋圖像的深入研究。通過使用不同的軟件,計算機視覺努力激活機器的雙眼去觀察和解釋圖像。
希望這篇文章對你有所幫助!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!