tft每日頭條

 > 生活

 > 國内首份ocr白皮書出爐

國内首份ocr白皮書出爐

生活 更新时间:2024-10-05 14:03:12

中新網9月29日電 28日,在工業和信息化部、北京市人民政府、國際電信聯盟ITU-T指導的2020AIIA人工智能開發者大會上,主辦方正式發布國内首份智能文字識别(OCR)能力測評與應用白皮書。白皮書從OCR發展背景、技術沿革、産業發展現狀、技術标準化、發展趨勢等多個維度,對當前國内OCR産業進行了一次詳細梳理,全面助推OCR技術産業化加速落地及可持續發展。

國内首份ocr白皮書出爐(全面盤點OCR産業發展态勢)1

OCR是光學字符識别(Optical Character Recognition)的縮寫,指利用機器将圖像中手寫體或印刷體的文本轉換為計算機可以直接處理的格式。作為計算機視覺領域的重要分支,OCR典型應用是通過圖像文字識别實現信息錄入。同時,由于文字和符号包含豐富的語義信息,基于OCR提取文字信息繼而進行分析,能夠幫助機器更好地理解圖像。

據了解,這份白皮書是由中國信息通信研究院、中國人工智能産業發展聯盟、騰訊雲AI計算機視覺中心、騰訊安全戰略研究部、騰訊優圖實驗室聯合起草。

新基建帶來新機遇,OCR技術發展三大趨勢

借助人工智能技術,近年來OCR性能的不斷提升為産業數字化催生出的更複雜的OCR應用場景提供了堅實支撐。同時,覆蓋手機、電子産品以及雲服務在内的更加多樣化的服務載體,進一步加快了OCR的普及,持續向社會生産生活的更多領域滲透。

尤其是今年4月,發改委明确将人工智能基礎設施列入“新基建”範圍,作為人工智能應用中最接“地氣”,商業推廣較為成熟的領域,OCR産業在“新基建”背景下無疑将迎來新的發展機遇,相關技術也将迎來新一輪的變革。

報告指出,OCR技術未來發展的三大方向主要包括一體化的端到端OCR模型、兼具高性能高效率的OCR、從感知到認知的智能OCR。

詳細來說,構建一體化的端到端網絡,同時對文字檢測和識别進行訓練,将成為OCR技術發展的重要趨勢之一。端到端的網絡設計不僅能夠減少重複計算,又能夠提高特征的質量,促進任務性能的改善。同時,大量的OCR應用需要在資源受限的移動端設備上運行,當前移動端OCR算法大多以犧牲一定的算法精度來換取運行速度,針對移動設備設計兼顧性能和效率的輕量OCR模型将是未來發展的重要方向。

另外,從感知到認知的智能OCR來說,OCR技術通常從計算機視覺領域出發,未來與自然語言處理技術、知識圖譜等更廣領域的交叉融合,通過語義及知識的深度挖掘提升OCR性能是重要趨勢。此外,在OCR中引入強化學習和元學習等新的學習範式,讓機器自主學習如何識别文字,也将成為研究熱點。

市場規模達133.81億美元,OCR成科技巨頭标配

目前,OCR技術已在金融、保險、醫療、交通、教育等諸多行業有了深入成熟的應用。未來随着傳統行業的數字化轉型,OCR應用範圍和場景将進一步擴展,市場規模将進一步增大。有權威機構預測,2025年全球OCR市場規模将達到133.81億美元。

早期受限于技術發展水平,OCR廠商通常從特定應用切入,例如車牌識别系統等,形成了一系列專用設備。近年來,越來越多的終端設備及應用均嵌入了OCR技術,并逐漸形成了從基礎設施、基礎能力到終端應用的完整産業鍊生态,也衍生出了卡證、票據等一系列細分OCR能力,通過組合的方式服務于各個行業。

國内首份ocr白皮書出爐(全面盤點OCR産業發展态勢)2

OCR産業生态圖

不難看出,OCR技術逐漸“下沉”為一項基本的能力,為上層不同的業務應用提供底層技術支撐。以騰訊雲為代表的科技巨頭和雲計算廠商正在紛紛加速布局OCR,在滿足自身内部業務需求的同時,不斷對外開放先進的OCR能力,OCR已然成為科技巨頭能力标配。

多行業場景成熟落地,首次發布OCR評測标準

在具體的落地應用層面,目前卡證識别、票據識别等标準場景文字識别已經相對成熟,手寫文字識别在教育、物流等行業的應用也在不斷擴大。複雜動态場景下的OCR技術和應用成為近兩年的熱門研究方向,比如在無人駕駛、機器人等場景利用OCR對視場中出現的文字進行識别等。

在此次發布的白皮書中,騰訊雲也公布了其多項OCR領域的典型落地案例。

豐巢快遞櫃通過使用騰訊雲聯合騰訊優圖實驗室提供的身份證OCR技術,身份證字段識别準确率高達99%,大幅提高了用戶寄件、取件的效率;甯波銀行通過采用騰訊雲聯合騰訊優圖實驗室打造的智能票據OCR解決方案,将識别的字段準确率提升至90%以上,更好地滿足了銀行業務場景的需要。搜狗廣告圖片文本審核借助OCR産品服務幫助客戶自動識别海量的圖片文字内容,從而高效地進行廣告圖片違法内容識别,降低客戶業務的違規風險。

值得一提的是,為全面降低OCR相關領域的應用門檻,避免出現魚龍混雜局面,白皮書也首次公布OCR評測标準和規範。

今年4月,中國人工智能産業發展聯盟制定了《OCR服務智能化分級技術要求和評估方法》,規定了OCR服務在功能、性能、安全等方面的技術要求以及評估方法。7月,OCR服務要求及評估方法在國際電信聯盟ITU-T SG16組成功立項,标志着深度學習背景下的OCR評測方法已經逐漸被國際标準組織所接受。

在此之中,騰訊深度參與推動OCR領域技術革新和标準制定,幫助企業客觀、全面地評價不同OCR服務能力。目前,由中國人工智能産業發展聯盟指導,騰訊雲開發的天鑒OCR服務引擎自動化評測平台,不僅能夠為OCR技術供給方提供技術測試服務,也将發布OCR技術或産品的測試結果,為需求方提供客觀公正的選型依據。

來源:中國新聞網

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved