tft每日頭條

 > 生活

 > 如易視覺識别算法

如易視覺識别算法

生活 更新时间:2024-12-05 11:32:50

日前,全球最負盛名的 AI 學術會議之一NeurIPS(Neural Information Processing Systems)公布了2022年論文接收結果。創新奇智投稿論文 《An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning》成功被NeurIPS 2022接收。

作為當前全球最負盛名的 AI 學術會議之一,NeurIPS 是每年學界的重要事件。NeurIPS全稱是 Neural Information Processing Systems,神經信息處理系統大會,通常在每年 12 月由 NeurIPS 基金會主辦。大會讨論的内容包含深度學習、計算機視覺、大規模機器學習、學習理論、優化、稀疏理論等衆多細分領域。 今年 NeurIPS 已是第 36 屆,将于 11 月 28 日至 12 月 9 日舉行,為期兩周。第一周将在美國新奧爾良 Ernest N.Morial 會議中心舉行現場會議,第二周改為線上會議。NeurIPS 2022 論文投稿早已在 5 月 19 日截止,今日官方終于公布了錄用結果。根據官網郵件中給出的數據,本屆會議共有 10411 篇論文投稿,接收率為 25.6%,略低于去年的 26%。

如易視覺識别算法(NeurIPS2022)1

論文解讀:

如易視覺識别算法(NeurIPS2022)2

圖1:論文概要

論文概述:

本文提出了一種基于反标簽學習的半監督少樣本圖像分類學習方法,包括以下步驟:構造元任務,使用預訓練的神經網絡作為特征提取器,提取元任務中支持集、查詢集以及無标簽圖像數據集對應的特征,并在支持集上訓練一個分類器用于後續分類任務;反标簽學習模塊以較高正确率給無标簽數據打上反标簽,分類器在反标簽上進行學習更新,不斷叠代直到無法選出反标簽。正标簽學習模塊,在反标簽模塊叠代結束之後,得到類别均衡且正确率較高正标簽,并用分類器進行學習更新。

本文通過卷積神經網絡提取元任務中對應數據的特征,通過反标簽構造模塊以較高正确率利用無标簽數據,并用分類器在反标簽數據上進行學習更新,進行叠代之後設計正标簽學習模塊獲得類别均衡且正确率較高的正标簽,用分類器在正标簽數據上進行學習更新,以更加充分且高質量的利用無标簽數據,可以獲得更高的少樣本學習圖像分類準确率。

創新背景:

随着深度學習的發展,卷積神經網絡在多個圖像任務上已經超過了人類的水平,但是這些模型的訓練依賴大量的數據,在現實生活中有些數據的采集難度較大,例如對液晶顯示屏幕所有種類缺陷數據的采集,另外這些數據的标注也需要耗費大量的人力和财力。 相比之下,人類視覺系統可以從少量的例子中快速學習到新的概念和特征,然後在新的數據中識别相似的對象。為了模仿人類的這種快速學習的能力,減少方法對于數據的依賴,少樣本學習近年來受到了越來越多的關注。少樣本學習旨在結合先驗知識快速地泛化到隻包含少量有監督信息的樣本的新任務中,在此設定下識别每個類别僅需要極少甚至一張帶标簽的樣本,所以可以極大地減少人工标注成本。

基于少樣本學習這樣數據量較少的設定,一個需要面臨的問題就是,在極少的帶标注數據上,很難讓模型較好的拟合到數據的分布。因此為了解決這樣的問題,少樣本學習中出現了結合半監督的研究方向。另外為了解決數據标注困難的問題,反标簽學習的方法也應運而生。反标簽顧名思義就是給數據打上相反的标簽,是一種間接的方式代表該數據不屬于某個類别。這樣的做法可以大大降低數據标注的錯誤,例如對于一個5分類問題來說,給數據打真實标簽即正标簽錯誤的概率為給數據打反标簽錯誤概率的4倍。另外在半監督少樣本學習當中,由于帶标簽數據很少,因此模型在初始階段很難有好的效果。用這樣的模型給無标簽數據标記僞标簽将會出現大量的錯誤以及類别不平衡的現象。在這樣的情況結合反标簽學習的方法就可以解決這樣的問題。本發明研究的基于反标簽學習的半監督少樣本學習方法,針對半監督少樣本學習,設計适合的反标簽标注方法,并結合反标簽學習解決半監督少樣本學習中出現的無标簽數據利用不充分等問題。

目前,出現了許多研究半監督少樣本學習的方法,但依然存在一些問題: 1)給無标簽數據标注僞标簽的正确率較低,錯誤标記的樣本會影響最後的結果;2)無标簽數據上标注的僞标簽存在類别不平衡現象;3)方法較為複雜。

本論文主要貢獻:

本論文提出了一種基于反标簽學習的半監督少樣本圖像分類學習方法。 方法具體如下:

步驟1,構造元任務,使用預訓練的神經網絡作為特征提取器用來提取圖像數據,提取元任務中支持集、查詢集以及無标簽數據集對應的特征,并在支持集上訓練一個分類器,用于後續圖像分類任務;

如易視覺識别算法(NeurIPS2022)3

步驟2,反标簽學習模塊以較高的95%正确率給無标簽圖像數據打上反标簽,用分類器在反标簽上進行學習更新,通過不斷叠代直到無法選出反标簽;

步驟3,正标簽學習模塊得到類别均衡且正确率高達85%的正标簽,并用分類器進行學習更新;

步驟4,用訓練好的分類器在查詢集上預測得到最後圖像分類的類别結果。

本文提出的方法與已有技術相比,其顯著優點為:

(1)本發明設計的反标簽學習模塊,通過給無标簽圖像數據标注反标簽并進行學習的方式,在模型效果還不好的初始階段,大大降低給無标簽圖像數據标注标簽的錯誤率;

(2)經過反标簽學習模塊之後,本發明設計的正标簽學習模塊可以得到正确率高且類别均衡的正标簽,繼續對模型進行訓練;

(3)本發明提出的方法相較于之前的方法流程簡單,可以更充分且高質量利用無标簽圖像數據進行學習,最後在圖像分類任務上得到了更好的效果。

如易視覺識别算法(NeurIPS2022)4

創新奇智CTO張發恩(論文作者之一)表示:“當前的深度學習技術對人工标注的數據樣本(也即帶标簽數據樣本)數量具有很大依賴性,如何減少對帶标簽數據樣本的依賴,利用較少的帶标簽數據樣本訓練出理想的視覺算法模型成為當下亟待突破的技術難點。 少樣本學習旨在從已有類别的數據中學習先驗知識,然後利用極少的标注數據完成對新類别的識别,打破了樣本數據量的制約,在傳統制造業等樣本普遍缺失的領域具有實用價值,有助于推動AI落地。”

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved