tft每日頭條

 > 生活

 > ocr識别屬于人工智能嗎

ocr識别屬于人工智能嗎

生活 更新时间:2024-09-17 08:00:33

ocr識别屬于人工智能嗎?人工智能技術正在深刻地改變辦公領域,下面我們就來說一說關于ocr識别屬于人工智能嗎?我們一起去了解并探讨一下這個問題吧!

ocr識别屬于人工智能嗎(人工智能時代的OCR)1

ocr識别屬于人工智能嗎

人工智能技術正在深刻地改變辦公領域。

“數據作為新型生産要素,是構成數字經濟的核心資源和重要基石,而辦公場景存在大量數據,AI有充足的‘用武之地’,比如OCR光學文字識别、語音識别、圖像識别等等,具有豐富的落地應用價值。”7月22日,在金山辦公的技術開放日上,華南理工大學電子與信息學院教授、廣東省琶洲實驗室OCR中心主任金連文表示。

“文字識别技術,我們又把它簡稱為OCR,它跟雲識别、圖像識别等等這樣通用的人工智能技術一樣,是可以把我們非結構化的數據,比如說文檔,轉換成為結構化的數字化的數據,從而可以支撐各種各樣的人工智能的創新應用,所以從這個意義上來講,文字識别這樣一項技術也是底層的OCR技術。”金連文說。

文字識别是最具有落地應用價值的人工智能的技術之一。“比如智慧辦公,我們拍一張圖片,通過OCR的技術就可以轉換成一個可編輯的文檔,這樣就可以提升辦公效率。比如在智慧教育當中的智慧閱卷,在智慧金融、交通、城市、旅遊等等,包括電商、智能設備、互聯網信息安全的内容審查等等,這麼一系列的應用當中都有非常廣泛的應用前景。”金連文舉例。

文字識别是一個典型的AI的人工智能技術應用落地的場景。“實際上人工智能的技術在十多二十年以前就開始在OCR的技術領域當中得到了應用。”金連文說,包括人工智能的三個巨頭,像Bengio、Yann LeCun、Hinton教授,他們在上個世紀90年代末期就開始用深度學習這樣的人工智能核心技術來解決OCR當中的關鍵問題。但是從2012年開始,人工智能的技術才徹底在OCR領域中解決了大量的問題。

為什麼過去這幾年才把OCR裡一些簡單的感知問題解決呢?“首先是因為過去七八年以來,開始數據量不是問題了。其次是因為算力也跟上來了。有一個觀點認為人工智能有三個要素:數據、算法、算力,這三個要素大家普遍認為它是人工智能的三個要素,我的觀點是,有數據、有算力、有算法,大概是可以解決人工智能當中感知層面的問題,但是還有結構化理解認知層面的問題是不能解決的。”金連文認為。

什麼是感知層面的問題?金連文舉例,比如說做一個人臉識别、一個文字的OCR的識别、字符的識别,這些都是屬于感知層面的問題,今天如果算力夠、數據夠,做一個人臉識别的引擎,或者一個簡單的文字識别的引擎,已經不是太大的問題。

“但是有些問題是在感知層面解決不了的,所以我想提一個觀點,人工智能可能還要加上知識,有了知識這樣的因素,才能使得我們去解決認知層面的問題,這裡講的知識包括物理常識、領域知識、語義知識,以及包括從大量的海量的無監督的數據去學習到的背後的知識。”金連文強調。

為什麼知識很重要?金連文舉例:“比如我這裡有一張圖,這張圖是一個烤肉火鍋店,但是今天很多文字檢測器沒有語義支持的話,它可能檢測出來的結果是這樣的,肉和火靠得近,所以烤和肉就沒把它連在一起,但是如果加上一些語義的知識,如果做一點理解的話,就不會犯這樣的錯誤。”

金連文認為,人工智能進一步的發展,要把數據和知識很好地利用起來,才能更好地去解決感知層面的問題。基于感知方面的問題,實際上在領域當中也有很多學者開始相關的研究工作。

金連文團隊在2018年就利用數學當中的路徑積分的領域知識和語言模型知識去訓練了一個連接手寫識别引擎。從去年到今年也利用了相關的領域知識構建了一個不需要仿冒數列簽名的筆記鑒别的識别系統。

“這些都是知識和傳統感知的數據層面結合起來,可以更好地去幫助我們去解決實際的人工智能的應用問題。”金連文表示,OCR/CV領域和知識推理(包括NLP)不斷融合的技術,應該是未來OCR技術中非常重要的發展趨勢。

文/科技日報記者 馬愛平

編輯/範輝

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved