簡述ocr技術以及流程-tft每日頭條

簡述ocr技術以及流程

生活更新时间:2025-08-21 03:17:14

什麼是OCR？

OCR英文全稱是Optical Character Recognition，中文叫做光學字符識别。它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來，并轉換成一種計算機能夠接受、人又可以理解的格式。文字識别是計算機視覺研究領域的分支之一，而且這個課題已經是比較成熟了，并且在商業中已經有很多落地項目了。比如漢王OCR，百度OCR，阿裡OCR等等，很多企業都有能力都是拿OCR技術開始掙錢了。其實我們自己也能感受到，OCR技術确實也在改變着我們的生活：比如一個手機APP就能幫忙掃描名片、身份證，并識别出裡面的信息；汽車進入停車場、收費站都不需要人工登記了，都是用車牌識别技術；我們看書時看到不懂的題，拿個手機一掃，APP就能在網上幫你找到這題的答案。太多太多的應用了，OCR的應用在當今時代确實是百花齊放啊。

OCR的分類

如果要給OCR進行分類，我覺得可以分為兩類：手寫體識别和印刷體識别。這兩個可以認為是OCR領域兩個大主題了，當然印刷體識别較手寫體識别要簡單得多，我們也能從直觀上理解，印刷體大多都是規則的字體，因為這些字體都是計算機自己生成再通過打印技術印刷到紙上。在印刷體的識别上有其獨特的幹擾：在印刷過程中字體很可能變得斷裂或者墨水粘連，使得OCR識别異常困難。當然這些都可以通過一些圖像處理的技術幫他盡可能的還原，進而提高識别率。總的來說，單純的印刷體識别在業界已經能做到很不錯了，但說100%識别是肯定不可能的，但是說識别得不錯那是沒毛病。

假如輸入系統的圖像是一頁文本，那麼識别時的第一件事情是判斷頁面上的文本朝向，因為我們得到的這頁文檔往往都不是很完美的，很可能帶有傾斜或者污漬，那麼我們要做的第一件事就是進行圖像預處理，做角度矯正和去噪。然後我們要對文檔版面進行分析，進每一行進行行分割，把每一行的文字切割下來，最後再對每一行文本進行列分割，切割出每個字符，将該字符送入訓練好的OCR識别模型進行字符識别，得到結果。但是模型識别結果往往是不太準确的，我們需要對其進行識别結果的矯正和優化，比如我們可以設計一個語法檢測器，去檢測字符的組合邏輯是否合理。比如，考慮單詞Because，我們設計的識别模型把它識别為8ecause，那麼我們就可以用語法檢測器去糾正這種拼寫錯誤，并用B代替8并完成識别矯正。這樣子，整個OCR流程就走完了。從大的模塊總結而言，一套OCR流程可以分為：

版面分析 -> 預處理-> 行列切割 -> 字符識别 -> 後處理識别矯正

從上面的流程圖可以看出，要做字符識别并不是單純一個OCR模塊就能實現的（如果單純的OCR模塊，識别率相當低），都要各個模塊的組合來保證較高的識别率。上面的流程分的比較粗，每個模塊下還是有很多更細節的操作，每個操作都關系着最終識别結果的準确性。做過OCR的童鞋都知道，送入OCR模塊的圖像越清晰（即預處理做的越好），識别效果往往就越好。那現在對這流程中最為重要的字符識别技術做一個總結。

識别方法

現在我們隻想單純地想對字符進行識别，那方法會有哪些呢？我列了一下可以采取的策略：

使用谷歌開源OCR引擎Tesseract
使用大公司的OCR開放平台（比如百度），使用他們的字符識别API
傳統方法做字符的特征提取，輸入分類器，得出OCR模型
暴力的字符模闆匹配法
大殺器：基于深度學習下的CNN字符識别

上面提到的OCR方法都有其有點和缺點，也正如此，他們也有各自特别适合的應用場景。

首先說開源OCR引擎Tesseract。搞字符識别的童鞋應該都聽說過Tesseract這個東西，這是谷歌維護的一個OCR引擎，它已經有一段相當悠久的曆史了。Tesseract現在的版本已經支持識别很多種語言了，當然也包括漢字的識别。畢竟Tesseract是外國人搞得一個東西，所以在漢字識别的精度上還是不能擺上台面，不過還是自己去改善。但是Tesseract在阿拉伯數字和英文字母上的識别還是可以的，如果你要做的應用是要識别英文或者數字，不妨考慮一下使用Tesseract，畢竟拿來就能得到不錯的結果。當然啦，要做到你想要的識别率，後期微調或者優化肯定要多下功夫的。

接下來說一下借用OCR開放平台做文字識别。現在很多大公司都開放了OCR的API供開發者調用，當然啦，小量調用是不收費的，但是大量調用就要收費了。最近我也在百度開放平台上調用OCR的API做一些識别的工作，說實話，在漢字的識别上，我們中國公司的技術還是頂尖的，在漢字識别的準确率上已經讓人很滿意了。比如我要識别一些文本，自己寫個python腳本，調用開放平台的服務，返回的就是識别結果了。這種模式有啥不好的地方嗎？首先是需要錢（當然每天小批量識别一下是不用錢的），第二是自己的控制程度不足，我們想要提升識别精度，我們不可以從OCR識别上做改進（畢竟别人的東西，我們改不了），能做隻是預處理和後期矯正，能做的還是比較有限的。但是，如果自己不想花大量時間做OCR模型并且手上有錢的話，這種識别方法還是OK的。

上面提到的都是用的是别人的東西，那我們想從頭自己做，咋辦？

那就自己做吧！先談一談字符模闆那匹配法。暴力的字符模闆匹配法看起來很蠢，但是在一些應用上可能卻很湊效。比如在對電表數字進行識别時，考慮到電表上的字體較少（可能就隻有阿拉伯數字），而且字體很統一，清晰度也很高，所以識别難度不高。針對這種簡單的識别場景，我們首先考慮的識别策略當然是最為簡單和暴力的模闆匹配法。我們首先定義出數字模闆（0~9），然後用該模闆滑動匹配電表上的字符，這種策略雖然簡單但是相當有效。我們不需要左思右想去建模，訓練模型，隻需要識别前做好模闆庫就可以了。

簡述ocr技術以及流程（OCR技術綜述）1

模闆匹配法隻限于一些很簡單的場景，但對于稍微複雜的場景，那就不太實用了。那此時我們可以采取OCR的一般方法，即特征設計、特征提取、分類得出結果的計算機視覺通用的技巧。在深度學習大放異彩之前，OCR的方法基本都是這種方法，其效果嘛，并不算特别好。在這裡簡單說一下這裡常見的方法。第一步是特征設計和提取，特征設計是一件很煩人的事情，做過模式識别相關項目的童鞋也深有體會，我們現在識别的目标是字符，所以我們要為字符設計它獨有的的特征，來為後面的特征分類做好準備。字符有啥特征呢？有結構特征，即字符的端點、交叉點、圈的個數、橫線豎線條數等等，都是可以利用的字符特征。比如“品”字，它的特征就是它有3個圈，6條橫線，6條豎線。除了結構特征，還有大量人工專門設計的字符特征，據說都能得到不錯的效果。最後再将這些特征送入分類器（SVM）做分類，得出識别結果。這種方式最大的缺點就是，人們需要花費大量時間做特征的設計，這是一件相當費工夫的事情。通過人工設計的特征（例如HOG）來訓練字符識别模型，此類單一的特征在字體變化，模糊或背景幹擾時泛化能力迅速下降。而且過度依賴字符切分的結果，在字符扭曲、粘連、噪聲幹擾的情況下，切分的錯誤傳播尤其突出。針對傳統OCR解決方案的不足，學界業界紛紛擁抱基于深度學習的OCR。

這些年深度學習的出現，讓OCR技術煥發第二春。現在OCR基本都用卷積神經網絡來做了，而且識别率也是驚人的好，人們也不再需要花大量時間去設計字符特征了。在OCR系統中，人工神經網絡主要充當特征提取器和分類器的功能，輸入是字符圖像，輸出是識别結果，一氣呵成。這裡就不再展開說明卷積神經網絡了，想要知道的細節的可以看我以前寫過的一篇博客《卷積神經網絡CNN總結》。當然用深度學習做OCR并不是在每個方面都很優秀，因為神經網絡的訓練需要大量的訓練數據，那麼如果我們沒有辦法得到大量訓練數據時，這種方法很可能就不奏效了。其次，神經網絡的訓練需要花費大量的時間，并且需要用到的硬件資源一般都比較多，這幾個都是需要考慮的問題。

在接下來的博客中，我将在工程上一一實現以上說到的幾種OCR的識别方法~~

OCR的發展

在一些簡單環境下OCR的準确度已經比較高了（比如電子文檔），但是在一些複雜環境下的字符識别，在當今還沒有人敢說自己能做的很好。現在大家都很少會把目光還放在如何對電子文檔的文字識别該怎麼進一步提高準确率了，因為他們把目光放在更有挑戰性的領域。OCR傳統方法在應對複雜圖文場景的文字識别顯得力不從心，越來越多人把精力都放在研究如何把文字在複雜場景讀出來，并且讀得準确作為研究課題，用學界術語來說，就是場景文本識别（文字檢測文字識别）。

簡述ocr技術以及流程（OCR技術綜述）2

從上圖可以看出，自然場景下的文字識别比簡單場景的文字識别實在困難太多了，現在雖然出了很多成果，但是離理想結果還是差很遠。

當然啦，除上面的場景文字識别外，曆史悠久的手寫體的識别到現在還是一件具有挑戰的課題，在深度學習的浪潮下，手寫體的識别已經前進了一大步，但是尚且沒達到印刷體識别那種可以商用的地步，所以啊，OCR的研究還得不斷地進行下去。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活 wpsoffice和騰訊文檔是一樣的...
從鵝廠去年發布的《中國白領辦公報告》來看，盡管傳統辦公依然統治白領：但仍有20.8%的辦公族使用在線文檔工具，并以其快速、便捷的優勢越來越受歡迎：所以今天來說說文檔界的幾大巨頭，我們該如何選擇适合自己的文檔軟件？測評順序>>>石墨文檔、金山... 2023-01-08
生活多喝茶水降壓嗎
研究發現，喝綠茶可以減少高血壓發生的機會。很多朋友都有喝茶的習慣，也有許多高血壓患者會用喝茶作為輔助降壓，來控制自己的高血壓，但是高血壓患者應該如何喝茶才能更有效的降血壓呢？原則一：避免喝濃茶高血壓患者應避開濃茶，因為濃茶中的咖啡堿興奮中樞... 2023-03-11
生活乳腺癌預後的四個指标
毫無疑問，乳腺癌是女性最常見的惡性腫瘤之一，可以說女性患癌最多的就是乳腺癌了。在全世界範圍内，每年有120萬婦女患乳腺癌，其中50萬人因乳腺癌而死亡。無論是在我國，還是在全球範圍内，乳腺癌的應對都是人們很關心的問題。而乳腺癌的早期診斷治療甚... 2023-01-25
生活滿嘴流油的大肉串
管它是鴨胗還是鴨腎？别争了，串一串，烤一烤，香辣夠味不油膩，太香了。說到撸串兒，我真是喜愛，特别是烤鴨胗，簡直就是真愛十年不變。每次去吃燒烤，牛羊肉可以不點，鴨胗卻是必須先來上一手打底兒的，在我們這邊，鴨胗也叫鴨腎，因為這個叫法，每次我寫譜... 2022-12-20
生活 q寵大樂鬥全攻略
Q寵大樂鬥是騰訊在2010年推出的網頁遊戲，是qq寵物大展身手的世界，以搞笑武俠為題材的格鬥類遊戲，玩家通過QQ寵物與好友間進行pk，樂鬥升級。前兩年QQ大樂鬥還很火的，電腦上手機上都保存着大樂鬥的網頁，每天都會上線，與同學朋友們争相pk，... 2023-02-23
生活王曉晨的這個稱呼是有原因的
随着《歡樂頌3》的完結，喜歡女性群像劇的觀衆又要陷入劇荒了，不過緊接着推出的男性群像劇《東八區的先生們》，倒是彌補了群像劇的空白，隻不過性别截然不同，兩部劇作的觀感也大相徑庭。《歡樂頌3》中除了張慧雯塑造的何憫鴻一角讓人喜歡不起來以外，其他... 2023-04-04
生活長輩做手術中該說些什麼
老媽81歲，上個月因為摔傷，住院治療。我多方打聽，查資料，問熟人，最後和姐姐商量，決定手術。和老媽講明手術的好處，老媽同意了。高齡老人手術風險大，需要進行身體評估。因為我對老媽的身體有信心，所以才敢冒風險。在家屬同意簽字時，姐姐猶豫了，但是... 2023-02-22
生活群星行星規劃怎麼修改
《群星》怎麼修改無人行星？以下是6399小編為大家帶來無人行星修改方法。遊戲問題：怎麼修改無人行星？問題解答：用planet_resource可以加資源，不過是随機加在任意方格裡的，沒法控制，你隻能加減加減這樣反覆刷到滿意為止星球種類能用控... 2023-02-25
生活子宮憩室修補成功率最高的手術
膠東在線8月25日訊(記者栾雪)随着二胎、三胎的開放，很多女性在備孕過程中進行檢查，特别是頭次剖宮産的女性，在檢查中發現子宮瘢痕憩室，那什麼是子宮瘢痕憩室呢，她對女性有什麼影響呢，會不會影響懷孕，孕前是否需要治療，一旦妊娠風險有多大等問題産... 2023-03-09
生活怎樣複印手上的身份證
怎樣複印手上的身份證?我們知道，經常要用到身份證複印件的，就是辦理一些業務時，複印身份證是必不可少的，下面我們就來說一說關于怎樣複印手上的身份證?我們一起去了解并探讨一下這個問題吧!怎樣複印手上的身份證我們知道，經常要用到身份證複印件的，就... 2022-12-19
生活被嫉妒怎麼辦
被嫉妒怎麼辦?被嫉妒應該保持好心态被人嫉妒那是因為我們有優秀的地方，比對方過得好的地方所以，面對被人嫉妒的情況，我們該做的就是不斷提升自己的能力，變得更加優秀不要在乎别人的眼光，我來為大家科普一下關于被嫉妒怎麼辦?以下内容希望對你有幫助!被... 2022-07-10
生活會意字禾
“敦dun”是甲骨文“亠口曰羊”的分化孳乳字，小篆的“敦”字承接金文；楷書一脈相承，隻是省掉了左邊下部的“羊”形，寫作“敦”。公羊配種，看起來有點野蠻，常常是不管母羊是否情願，便強行爬跨上去。因此，“敦”有猛地往下放的意思，這一意義由後起的... 2023-01-31
生活姜gary和兒子的綜藝節目是哪一季
就在今天下午，韓國男明星姜gary在微博曬出兒子腳印照片，并發文：“同大家分享，這是我的兒子!請大家祝福Gary的junior吧!”從結婚到現在兒子出生才花了半年多的時間，看來結婚之前就已經有寶寶啦。這次曬兒子照片粉絲紛紛表示：“我還在粉周... 2023-03-02
生活缺鋅吃什麼補鋅最快
專家告訴大家，缺鋅有哪些症狀，怎樣能找到補鋅的最佳方法——3Symptomsofzincdeficiencyandbestwaysformorezincintake凱利·瓊斯（KellyJones），科學碩士，注冊營養師，持證運動膳食學專家... 2023-03-21
生活戴蔡司功能眼鏡是什麼感覺
作為一個準互聯網從業者，每天面對電子屏幕是我日常工作最重要的部分，眼鏡是一個必備但經常容易被忽視的配件。我常用的眼鏡非常普通，尤其是鏡片的質量在當初配鏡的時候對此并沒有什麼了解，隻是感覺能戴，但在佩戴一段時間後會出現很明顯的眼睛疲勞。尤其是... 2022-11-20
生活肇慶市各地打醮
榆林地區位于陝西的最北端，西北與内蒙接壤，靠近毛烏素沙漠，東臨黃河，西連甯夏、甘肅，南接延安地區。目前，這裡仍有相當多的一部分人居住在山大溝深的黃土高塬深處，生活條件艱苦，醫療條件較差，文化教育相對滞後。陝北榆林地區是一個地域文化深淵，民俗... 2022-11-23
生活成長的煩惱1-7季166集高清英文
成長的煩惱1-7季166集高清英文?#「閃光時刻」主題征文二期#，我來為大家科普一下關于成長的煩惱1-7季166集高清英文?下面希望有你要的答案，我們一起來看看吧!成長的煩惱1-7季166集高清英文#「閃光時刻」主題征文二期#今天，你熬夜了... 2023-03-12
生活泡椒水制作方法
泡椒水制作方法?首先就是要準備好必備的材料這些材料包括：尖椒、白醋、白糖和鹽等之類的都要準備好才行還有備用的工具是壇子，這樣才能釀出更好的泡椒水出來，我來為大家科普一下關于泡椒水制作方法?以下内容希望對你有幫助!泡椒水制作方法首先就是要準備... 2022-05-31
生活各大美院校考時間安排
各大美院校考時間安排?近日，中國美術學院、廣州美術學院、湖北美術學院都對外公布了2021年校考情況據悉全國共有11317名考生進入中國美術學院2021年校考複試，國美計劃招收本科生1823名今年，全國報考廣州美術學院現場考試人數共20325... 2023-03-09
生活到了中秋節賞月最好時間
2022年9月10日将迎來一年一度的中秋佳節，今年是“十五的月亮十五圓”也是中秋賞月最佳時刻，記得許願網友：海上月是天上月，眼前人是心上人，心上人賞天上月，天上月照有情人網友：可惜中秋節沒法回家網友：到時候對着許個心願。願不在有疫情。願有情... 2023-03-27
生活增值稅發票什麼時候要彙總
5月起，增值稅多項開票政策有變！這3大變化一定要清楚！這份最新的發票開具指南，請收好！變化一：收費公路通行費電子票據開具新規來了！附：通行費電子票據編碼規則政策依據：《交通運輸部财政部國家稅務總局國家檔案局關于收費公路通行費電子票據開具彙總... 2023-01-17
生活 jojo會不會出第九部
近日，一則消息表明，荒木飛呂彥『JOJO的奇妙冒險』第8部「JoJolion」将于下月完結！這個消息一出來，讓JO廚一陣激動，但是回頭一想，還有那麼多坑沒填，荒木到底要怎麼圓回來。JOJO福音篇從2011年開始連載，至今已經有10年了，連載... 2023-03-19
生活怎樣清洗大龍蝦的内髒
怎樣清洗大龍蝦的内髒?平時清洗大龍蝦時可以把多餘的腳全部剪掉，隻保留前面的兩隻大鉗的，我來為大家講解一下關于怎樣清洗大龍蝦的内髒?跟着小編一起來看一看吧!怎樣清洗大龍蝦的内髒平時清洗大龍蝦時可以把多餘的腳全部剪掉，隻保留前面的兩隻大鉗的。要... 2022-08-22
生活法式中長款腰帶
在日常的服裝搭配單品中，有個很關鍵但是不起眼的配飾——腰帶，相比于胸針或腕表等錦上添花之物，腰帶往往是能快速提升整體服裝質感的利器，增加層次感的同時，環腰的佩戴方式也更能彰顯穿衣者的風格。而如何挑選一根好的腰帶，也便成為了關鍵所在。法國頂級... 2023-03-12
生活做什麼小生意能月賺三萬
目前市場上的小生意，都是一些沒有生活門路的普通人，在掙一些養家糊口的辛苦錢，說到暴利，基本不可能。那麼，現在市場上5000元能做的小生意，有哪些能一個月實現收入一萬多？根據當下的市場情況，我這裡推薦一些，僅供參考。人力資源這個小生意不需要本... 2023-01-12
生活有氧減脂訓練動作tabata
首先做一下回顧：什麼是Tabata？如果你還不知道什麼是Tabata間隔，我可以告訴你：它是由日本科學家IzumiTabata博士創造的一種高強度間隔訓練方案。每個Tabata間隔由20秒高強度（盡全力）訓練和10秒間歇組成。重複8輪，總計... 2022-12-10
生活大葉黃楊球與小葉黃楊球區别
小葉黃楊球在園林中常用作綠籬及背景種植材料，也可叢植草地邊緣或列植于園路兩旁。若加以修建成型，更适合用于規則式對稱配植，常将其修剪成圓球形或半球形，用于花壇中心或對植于門旁。同時，亦是基種植、綠化和工廠綠化及會場裝飾等。它的主要産地為中國江... 2023-03-09
生活冬天泡腳秋天泡腳的好處有哪些
腳是陰血的大本營，三條陰經都彙集于此：足少陰腎經、足太陰脾經、足厥陰肝經。腎生血，肝藏血、脾統血，所以，養護好您的雙腳至關重要。下面就和大家分享一些關于泡腳的知識。一：晚上泡腳為什麼能補血血虛、血淤→手腳冰涼、舌質黯淡、臉上有斑、心髒發緊、... 2023-01-21
生活移動服務文化大家談
移動服務文化大家談?“尊敬的朱市長，您好在這裡我要表揚移動公司一位窗口工作人員幾天前，我到文昌西路移動大廳辦理業務……令我很感慨的是這位年輕同志的專業、細心、耐心……把人性化的服務做到了極緻…我覺得她就是最美移動人”這是一封用戶發到市長信箱... 2022-11-13
生活圍裙款式種類
圍裙款式種類?無紡布是一種非織造布，它直接利用高聚物切片、短纖維或長絲通過各種纖網成形方法和固結技術形成的具有柔軟、透氣和平面結構的新型纖維制品更具經濟性、牢固性、環保性，我來為大家科普一下關于圍裙款式種類?以下内容希望對你有幫助!圍裙款式... 2022-06-06

tft每日頭條

> 生活

> 簡述ocr技術以及流程

簡述ocr技術以及流程

相关生活资讯推荐

热门生活资讯推荐

网友关注