CDA數據分析師 出品
編輯:JYD
大家好,我是曹鑫老師,今天要給大家分享的是數據标注類崗位。
1.下面演示一個實際案例,幫您更好的了解這類崗位。
理解數據标注之前先來理解一下機器學習,簡單來講,機器學習就是讓計算機也可以‘聽音識曲’、認識‘花鳥魚蟲’。而數據标注就可以理解為手把手教機器‘讀書寫字’的老師,那麼,教授過程中所使用的‘教材’和‘教學方法’分别是什麼呢?比如,本節課的内容是教授計算機識别圖片中的貓,則所用的‘教材’就是大量的貓的圖片,‘教學方法’就是數據标注員将各圖片中的貓标注出來,并告訴計算機‘這是一隻貓’,目的是通過這樣大量的、反複不斷的練習,使計算機掌握貓的特征,當再次拿到新的關于貓的圖片後,計算機可以将其自動識别,也就是說數據标注的核心是标出想讓計算機學習的内容,通過反複訓練讓其掌握學習内容的特點并達到自動識别的效果。
2.如何進行數據标注
仍以教授計算機識别貓mao為例,過程如下:
1) 收集大量的關于貓的圖片,并進行數據清洗,包括去除無效數據、整理格式等,具體要求需要與算法人員确認。
2) 将各圖片中的貓進行标注,标注完成後将圖片劃分為訓練集和測試集,使用訓練集作為計算機學習貓特征的‘教材’,将測試集用來檢測計算機的學習效果,得到本次學習的準确率。
3) 基于計算機的學習效果,不斷優化标注過程,使得内容對應的特征更加準确、明了,從而使計算機擁有對貓更加準确的識别能力。
總的來講,數據标注就是對收集的數據,包括文本、圖片、語音等等,進行整理與标注的過程。以上就是數據标注類崗位日常工作中的一個案例。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!