裴同學 | 語音标注員
将“牛德華”變成“劉德華”
裴同學是一名語音标注員,這是一個随着智能語音交互設備的普及而新出現的職業。他的主要工作就是将智能語音交互設備無法識别的字、詞、句子進行标注,然後“翻譯”過來,再發送回去以便智能設備進行學習。
那麼操作起來是什麼感覺呢?裴同學這樣說道:“比如一個有口音的人對智能音箱或交互設備說‘播放一首牛德華的歌’,智能設備需要分析出用戶真正的意思是想要聽一首劉德華的歌。我的工作就是将設備收集到的語音‘牛德華’标注成‘劉德華’,再發回給智能設備研發單位,供智能設備進行學習,使智能設備下次聽到‘牛德華’時,能準确地轉化為‘劉德華’”。
因此,裴同學需要每天在群裡領取包含各種詞、句的數據包,然後進行标注。他每次在群裡領取一個包含150條語音的數據包,完成對數據包内語音的标注後再領取下一個數據包。
據裴同學說,這項工作要求熟練使用office等辦公軟件,因為現在是實習階段,每标注1個小時的有效時長語音,能得到100元的報酬,一個月可以賺到3000元到3500元。
馬同學 | 圖像标注員
教人工智能認識新世界
今年24歲的馬同學,也是一名數據标注師,但她标注的内容不是語音而是圖片,偶爾也會标注一些視頻影像。她與裴同學不同的是,她不是通過群來領取任務,而是通過衆包平台,“衆包平台是開放式的,隻要注冊并通過在線學習和考核,誰都可以在平台上領取任務。”雖然,馬同學和裴同學标注的數據内容和領取任務的方式不同,但他們都是為那個從未見過的AI在打工。
“圖片标注是根據任務要求,在圖片上找到需要标注的物品、部位進行框選或标注記号點。比如,一張人臉圖片,有的任務隻要求将人臉部進行框選,讓AI知道被标注的部分是一張人臉。有的任務卻要求在人臉圖片上标注幾十甚至上百個記号點,以此讓AI了解哪裡是人的眉毛,哪裡是眉梢,哪裡是眼睛,哪裡是内眼角,哪裡是外眼角……”馬同學說。
雖然馬同學從事數據标注的時間還不長,但現在她已經是一名成熟的數據标注員了,每天都能标注2000到3000張圖片。
在問到實習圖片标注師能賺多少錢時,馬同學說,“每張圖片根據任務要求的不同,獲取的報酬也不同。隻是簡單框選人臉這樣的任務,标注一張圖片需要兩三秒鐘。如果是标注幾十個甚至上百個記号點這樣的任務,需要的時間稍微長一些,但報酬也會相應提高,平均每張圖片在0.3元至0.4元之間。我現在平均每個月能達到3000元左右的收入,對于我這樣一個實習生來說,已經是很高的工資了。”
以下是大學君和兩位數據标注員之間的對話:
從事數據标注需要每天對着電腦,你們不會覺得枯燥嗎?
數據标注為我打開了更大的世界,因為經常接觸不同的項目,每個項目涉及的領域也不同,會經常帶來新鮮感。更重要的是,這會是一個持續發展的行業。
我覺得數據标注師這份‘科幻’的職業實實在在地改變着現實生活。自動駕駛、人臉支付、智慧醫療、智能家居……人工智能正在給生活帶來越來越多的便利,這背後都有着數據标注師的功勞,所以,我覺得很驕傲!
看了上面兩位數據标注師的介紹,你是不是對數據标注工作有了更深一層的認識呢?如果你想從事數據标注工作,那就随時關注58同城大學未來産業學院的動态吧!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!