随着機器視覺的發展,光學字符識别(Optical Character Recognition,OCR)技術得到越來越廣泛的應用。OCR字符檢測技術是通過光學圖像采集設備采集圖像,接着基于圖像處理系統進行圖像的預處理、檢測與識别。
OCR字符檢測流程
字符識別算法是OCR字符檢測技術的重要組成部分。OCR字符檢測技術-般由圖像預處理與字符識別兩個部分組成。圖像的預處理是對光學成像設備獲取到的原始圖像進行處理,進而将圖像分割并歸一化為一個個獨立的字符;字符識别部分是将分割出的字符進行識别,并将識别出的字符信息整合成字符串信息進行輸出。
采集到的原圖像經過預處理後得到單枚字符,接着将單枚字符圖像數據傳入識别算法部分。常見的字符識别算法如下:
1、 模闆匹配算法
模闆匹配法是通過計算目标圖像與搜索圖中所有子圖的相似度,其中相似度最大的即認為是最佳待匹配的位置。模闆匹配法根據匹配的基本原理演變出多種匹配計算方式,如序貫相似性匹配、距離變換、最小均方誤差等。這其中最簡單的就是最簡單的圖像作差法,當然這種方法隻适用于待識别的類型比較少,并且待識别的圖像差異性比較大的場景當中。
OCR技術中使用模闆匹配法時首先要建立标準的模闆字符庫,接着将待識别字符圖像與模闆字符庫中字符進行匹配相似度計算,得到匹配相似度值最大的就是相對應的字符識别結果。模闆匹配的優點在于識别過程直接采取兩幅圖像間的相似匹配度,在某些特定的場景中有着很高的實用性。
2、支持向量機
支持向量機(Support Vector Machine,SVM)是基于統計學理論的一種分類識别算法。SVM在小樣本的分類領域的應用中具有很好的效果。經過長期發展,SVM出現了許多衍生算法,如最小二乘SVM、半監督SVM等。
支持向量機分類算法不僅對于小樣本的情況具有較好的分類效果,并且對高維和線性不可分的問題進行了很好的解決,這是該算法的主要優點,但該算法也有弊端,例如核函數的選擇,以及算法的實時性較差等問題。
3、貝葉斯分類算法
貝葉斯分類算法(Bayes)主要原理是通過Bayes定理對未知樣本進行預測,并計算樣本進行各個類别的可能性,最後通過概率統計對圖像實現分類。貝葉斯分類方法的主要優點在于魯棒性強,穩定性好;其缺點在于Bayes模型基礎假設了不同屬性間的概率獨立,即相互不影響。因此,使用該方法時要考慮應用場景。
4、神經網絡算法
神經網絡算法常用在解決分類和回歸問題。OCR技術中也廣泛使用了基于神經網絡的算法,字符圖像在使用神經網絡分類器進行識别時,根據網絡的輸入層的不同可以分為兩種情況:一是将二維的字符圖像直接作為網絡的輸入,将圖像的各個像素點作為節點進行全連接,這種方法可以實現較高的識别正确率,且抗幹擾能力強,但是網絡運算量較大,會花費較長的時間訓練網絡;二是對字符圖像進行特征提取,然後将提取到的字符特征信息作為祌經網絡的輸入來進行網絡的訓練,這種情況可以有效減少網絡訓練所需的時間,但這種方式訓練的網絡對字符識别正确率的高低取決于字符特征信息提取的有效程度。
随着OCR字符檢測技術的飛速發展,應用領域逐漸滲透到工業、銀行、半導體、交通運輸等諸多領域。比如,筆記本外殼表面的字符檢測系統中,可以通過識别表面的字符信息将筆記本外殼進行型号歸類。在金屬閥門的歸類系統中,可以通過識别閥門表面标志的字符信息,将規格不同的閥門有效分離。在銀行的單據識别系統中,可以通過OCR技術識别存取款金額,從而使機器能夠進行自動化工作,提高了銀行的工作效率。在襯布表面的疵點檢測系統中,可以通過識别襯布表面标識的字符信息,将檢測的成品進行分類入庫。總之,将OCR字符檢測技術應用到不同領域,都給生産生活帶來了很大的便利。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!