OCR在資産管理系統的應用-tft每日頭條

OCR在資産管理系統的應用

科技更新时间:2026-07-24 07:17:28

OCR是通過算法識别出圖像中的文字内容，算是圖像識别的一個分支。那為什麼固定資産管理系統中會用到 OCR 呢？

一、從業務說起：為什麼需要 OCR？
為什麼固定資産管理系統中會用到 OCR 呢？就得從梳理需求時遇到的問題說起。

固定資産的全生命周期管理的第一步是“資産入庫”，而入庫是一個非常繁瑣的過程，需要将大量信息錄入系統。通過前期調研發現錄入過程費時費力，還經常出現錄入錯誤的問題（比如設備型号、序列碼是較長的數字、字母序列，人工錄入很容易出錯）。

有沒有辦法解決這個痛點呢？受證件識别的啟發，我們想到了 OCR 輔助人工錄入，那麼接下來就是調研這種方案的可行性了。
二、關于 OCR
OCR，也就是 optical character recognation（光學字符識别），是通過算法識别出圖像中的文字内容，算是圖像識别的一個分支。OCR 對純文本的識别已經比較成熟，識别率普遍可以達到 90%以上，百度、阿裡、騰訊等各大廠都有相應的服務可以直接調用。
1. OCR 分類

OCR 技術可以按字體類别、識别語言、識别場景進行細分，每個細分的算法有所不同，現在暫時還沒有非常通用的算法同時适用于多個分類。

其中：
印刷體識别成熟度要高于手寫體（原因也比較好理解，印刷體比較規範，手寫體五花八門有時候人都難以辨認）。
中文和西文的識别成熟度高于小語種，中英文混合識别也能比較好的解決。
自然環境中的文字識别難度也要大于文檔圖片識别，因為自然環境中文字所處環境要更加複雜，文字檢測難度要大于文檔圖片。
對特定格式文檔（如身份證、發票、成績單）的識别要好于自由文檔（文字、表格、圖片、公式混排）。

調研到這裡，我們可以發現：OCR 輔助資産入庫的需求，屬于上述分類裡的【自然環境】下的【中英文混合】【印刷體】識别。目前文字識别印刷體識别已經比較成熟，但自然環境下的拍照可能會給識别帶來一些難度，初步判斷 OCR 輔助人工進行資産入庫信息錄入是可行的。
2. OCR 算法理解

既然 OCR 是圖像識别的一種，那麼處理的流程就和大多數圖像識别算法是一緻的，即預處理-圖像檢測-圖像識别。以自然環境下的文字識别為例，OCR 算法的工作流程大概是這樣的：

預處理：文本經過掃描或拍照後會發生形變等問題，會對識别造成幹擾，預處理就是通過灰度化、二值化，傾斜校正等方式消除這種幹擾，以提高識别準确率。其中傾斜矯正的常見算法有投影法、hough 法等。

文字檢測：目的在于找出文字的區域，是文字識别的基礎。簡單背景（e.g.掃描、截屏）和複雜背景（e.g.廣告牌、說明書）下的文字檢測方法差異較大，實現算法可以分為傳統 CV 算法和 DL 算法兩大類。
形态學方法：通過膨脹腐蝕等操作找到文字區域，隻适用于簡單背景。
MSER：常用的傳統文字檢測算法，檢測速度快，在簡單背景和部分複雜背景中适用。但背景特别複雜時，檢測效果可能較差。
CTPN：是 CNN 和 RNN 相結合的算法，适用于簡單和複雜背景的文字檢測，但文字傾斜時的檢測效果較差。
SegLink：可以用于檢測傾斜文字（但文字間隔不能太大）。
EAST：端到端文本檢測方法，也可用于檢測傾斜文字，檢測的準确性和速度都不錯。

文字識别：文字識别又根據文字的長度分為定長（e.g.驗證碼）和不定長。不定長文字識别現在主要是通過 DL 算法實現，目前兩大主流技術是 CRNN OCR 和 attention OCR。由于文字識别的特殊性，雖然其表現形式是圖像，但本質是序列化的文本。所以不論是CRNN還是attention，思路其實都是用CNN提取特征，然後用RNN處理序列化，充分運用了文本圖像的所有信息。

通過對 OCR 工作流程以及主流算法的了解，我們能對後續技術實現有個大概的認識，和 RD battle 時候也更加有底了。
三、功能設計
1. 核心場景

最近公司采購了一批新的辦公電腦，資産管理部門的小方來到倉庫打算對這批電腦進行入庫登記，他拿出手機打開 app，對着每台電腦上的标簽進行拍照，标簽上的信息就被識别出來填入相應的輸入框，很快小方就完成了入庫登記的工作。
2. 業務流程

對用戶來說 OCR 識别的過程是無感的，操作上隻是用拍照代替了手工填寫某些字段的步驟。
3. OCR 實現中的幾點考慮

1）輸入和輸出

在本需求中，OCR 算法的輸入就是用戶拍攝的照片，然後需要把算法的識别結果填寫到資産登記表單中相應的輸入框中，所以需要确定：a）識别哪些字段；b）每個字段識别出的結果。

a）識别哪些字段：綜合考慮了常見的資産标簽類型，結合最開始我們遇到的問題“字母數字序列輸入容易出錯且效率低”，确定了【資産名稱】【型号】【SN碼】三個需要識别的字段，也就是 OCR 處理完的結果隻是中間結果，後邊還需要做一個類似标注問題的處理（标注問題的處理方法暫不在這裡展開）。

b）文字識别的結果反映到頁面上就是把識别出來的字段填到相應的文本框中，所以需要算法部分輸出的結果是“型号：Lenovo IdeaPad Y580”這樣的 k-v 形式。

細化一下可以得到下圖：

2）服務端 or 客戶端

模型直接放在客戶端的好處是可以離線使用，缺點也十分明顯：一是識别準确率會受影響；二是安裝包會變大；三是算法叠代必須等軟件整體更新。所以除非是特殊的離線要求，還是把識别放在服務端好一點。

3）技術選型

實現途徑無非兩種：自研或者調用第三方服務。

自研的話，也不太可能從輪子造起，一般是在成熟的開源項目（如 chinese-ocr）或者是團隊已有的算法基礎上優化，最後得到的模型在特定場景的準确度肯定會比通用服務好。

自研算法主要包括兩方面的工作：一是數據集獲取、标注；二是模型優化，時間和人力成本都較高。但出于團隊發展、算法積累以及後續可能需要私有化部署的考慮，我們最後還是選擇了自研的形式。

為了給自研提供支撐和幫助，我對第三方服務也做了一些調研，如果有小夥伴恰好有類似的需求也可以參考。百度、阿裡、騰訊三個開發平台都沒有針對我們這種需求的特定解決方案，所以隻能使用通用 OCR 模型。

以同一張标簽圖片為例（實際中試驗了不同分辨率、不同品牌的資産标簽），三個平台通用 OCR 識别結果如下：

（百度AI開發平台）

（阿裡雲）

（騰訊AI開放平台）

可見通用 OCR 模型已經能比較好的識别出資産标簽信息，所以調用第三方服務的方案也是可行的。

4）性能需求
由于用戶需要即時獲得識别結果，正常網絡環境下，處理單張圖片請求到返回結果應該在2s以内；
由于後續流程中有人工确認、更正信息的步驟，所以在平衡精度和召回率時，可以适當地提高召回率。
4. 優化思路：批量處理

個人認為批量操作是 2B 業務的一個核心思想。設備特别多的情況下每個設備拍照-錄入這種流程也會比較慢，而且一批設備很大概率上是同一品牌型号的，所以批量錄入的需求是存在且可以實現的（比如輸入相同信息，然後批量識别 SN 碼）。

實現批量錄入的需求，一方面前端業務流程需要調整，另一方面 OCR 算法為适應批量識别在速度上也需要提升。這也是這個功能點後續優化的方向~
參考資料

大話文本檢測經典模型：CTPN

大話文本識别經典模型：CRNN

自然場景OCR檢測(YOLOv3 CRNN)

端到端不定長文字識别CRNN算法詳解

本文由 @LCC 原創發布于人人都是産品經理，未經許可，禁止轉載。

題圖來自Unsplash，基于CC0協議。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技胎兒出生前有什麼征兆
第一、這個根據每個媽媽的身體狀況不同，胎兒出生前的征兆也不一樣，一般胎兒出生前媽媽都會羊水破裂。第二、另外還有一種最為常見的征兆就是見紅，這也說明寶寶即将出生了，所以準媽媽要格外留心了。第三、寶寶出生前每個準媽媽都會出現陣痛，随着陣痛的頻率增加，陣痛的時間增加，說明寶寶要馬上出生了，這個過成最為辛苦。第四、還有一種情況是，寶寶即将出生時，有的準媽媽會出現腹部下墜，腰部不适，并伴随着腹部疼痛的現象。 2023-07-07
科技 iphone6plus無法連接wif...
1、打開iphone6plus手機，看到主界面，選擇設置。2、設置界面中往下拉，找到通用”選項。3、通用選項設置裡面，選擇還原。4、出現了可以還原的條目，選擇還原網絡設置。5、這時候會出現确認提示，确認點擊還原網絡設置。6、之後iPhone會自動重啟，重啟完成之後網絡設置清空，重新連接wifi網絡。 2023-07-07
科技無線網卡是幹什麼用的
演示機型：華為MateBookX系統版本：win10無線網卡是是一種終端無線網絡設備，需要在無線局域網的無線覆蓋下通過無線連接網絡進行上網使用。無線網卡是一種不需要連接網線即可實現上網的設備，無線網卡自誕生以來，因其優越的靈活性和便捷性，發展迅速，十分受歡迎。無線網卡：對于我們電腦中内置或者外置無線網卡則需要使用到無線網絡信号或者AP信号，這些信号是由無線路由器實現的，也就是說，此類無線網卡隻是無 2023-07-07
科技怎樣給嬰兒去黃膽
第一、給寶寶多排洩，幫助去除黃膽。如果寶寶出生七天後黃疸偏高，醫生會開茵栀黃，用藥去除黃膽，這種藥比較苦，寶寶一般都很難喝。第二、曬太陽新生兒容易出現黃膽。可以将寶寶帶到陽光下，寶寶的皮膚可以暴露在陽光下。小心遮住寶寶的眼睛，以免炎熱的陽光照射寶寶的眼睛。第三、退黃宜活血，促進血液循環和祛痰，可以改善肝髒微循環，消除膽汁淤積，促進肝細胞的再生和修複，并具有強烈的利膽黃化作用。第四、堅持母乳喂養，一 2023-07-07
科技 nova6開售時間
1、華為nova6已在12月12日10：08開售。2、nova6手機屏幕尺寸6.57英寸屏幕分辨率2... 2023-07-07
科技平闆電腦刷機教程
1、到自己平闆官方網站下載你機子對應的固件包。常見平闆的固件下載地址：昂達平闆固件下載、台電平闆固件... 2023-07-07
科技閑魚買手機要注意什麼
1、首先我們要記得一個道理，便宜沒好貨，所以我們看到低于市場價的手機基本是有問題的，所以價格太低的我... 2023-07-07
科技筆記本玩lol掉幀是為什麼
演示機型：華為MateBookX系統版本：win10APP版本：英雄聯盟11.15筆記本玩lol掉幀可能是因為溫度過高、顯卡占用過高、CPU占用過高等原因。如果溫度過高，建議不要遊戲時間過長了，或者給筆記本裝個電風扇來散熱。若是CPU占用過高，可以關掉後台無用的程序。若是顯卡占用過高，能調低遊戲畫面質量來提高遊戲幀數。英雄聯盟：由美國拳頭遊戲開發、中國内地由騰訊遊戲代理運營的英雄對戰MOBA競技網 2023-07-07
科技如何打開iso文件
1、ISO，國際标準光盤文件系統格式，符合ISO9660标準的光盤鏡像文件格式。2、文件擴展名通常為... 2023-07-07
科技 oppo怎麼解鎖圖案密碼
1、OPPO手機在連接電腦的壯态配合調試軟件長按音量上+電源鍵,打開關機菜單,點擊重啟會強制彈出的菜... 2023-07-07
科技 ipad已停用簡單恢複
1、iPad已停用可以用iTunes軟件來解鎖，我們首先要将iPad與電腦連接。2、長按電源鍵，出現... 2023-07-07
科技華為手機拍煙花技巧
1、關掉你手機的HDR和閃光燈功能：在晚上光線條件不好，可能很多人會想着用HDR功能來均衡畫面的曝光... 2023-07-07
科技可以提前四個月去換年檢合格标志嗎
1、不可以。2、檢車是提前60天，交強險是提前90天。換駕駛證可以提前90天。3、小車換年檢标志需要行駛證、機動車交通事故責任強制保險憑證、車船稅納稅或者免稅證明等材料，到當地車輛檢驗機構辦理檢驗後取得。6年内免上線檢測的新車可以去當地車管所、交警隊、機動車檢驗機構等地換領。4、申請前，機動車所有人應當将涉及該車的道路交通安全違法行為和交通事故處理完畢。申請時，機動車所有人應當填寫申請表并提交行駛 2023-07-07
科技如何徹底删除icloud裡的照片
以iPhone12、ios14為例。打開手機的設置選擇自己的ID進去到如下畫面，然後選擇Icloud；點擊管理存儲空間；點擊下列中對應的照片；最後點擊删除并停用即可。小提示：蘋果手機設定一個30天的恢複期，如果後悔删除某個照片，可以到誤删除的系統裡找到并且恢複。 2023-07-07
科技 dhcp是什麼意思開不開
以華為MateBookX、EMUI11為例。建議開啟。動态主機配置協議（DynamicHostConfigurationProtocol），簡稱DHCP，是一個應用于局域網的網絡協議，該協議允許服務器向客戶端動态分配IP地址和配置信息。該協議位于OSI模型的應用層，使用UDP協議工作，主要有兩個用途，一個是用于内部網或網絡服務供應商自動分配IP地址給用戶，另一個是用于内部網管理員作為對所有電腦作中 2023-07-07
科技藍牙怎麼連接不上手機
1、藍牙耳機沒有進入配對模式。解決方法：每一款藍牙耳機都有一個功能按鍵，長按多功能按鍵直至紅藍燈交替... 2023-07-07
科技屏幕校準在哪裡
1、有的時候由于手機系統版本過舊，會導緻小米手機觸屏沒反應。可将手機系統升級到最新版試試。2、在撥号... 2023-07-07
科技蘋果系統自己升級系統怎麼辦
1、蘋果手機有一個不好的地方就是系統的自動更新，一有新系統就會推送消息并且自做主張的下載好更新文件，... 2023-07-07
科技手機無服務怎麼辦
1、确定手機卡可用，且手機卡内存有餘額。在手機上打開設置，打開“飛行模式”。2、十幾秒後關閉飛行模式... 2023-07-07
科技蘋果手機怎麼連接到電腦
1、下載iTunes，點擊“iTunes”圖标。2、同時，我們要将iPhone手機通過數據線連接電腦... 2023-07-07
科技如何進入dos
1、最為常用的進入方法就是使用組合鍵，同時按下鍵盤上的win和r鍵，這樣就會彈出運行窗口。2、在運行... 2023-07-07
科技 iphone
1、iphonexsmax本身默認是電量百分比，但是顯示位置不夠，按住電池圖标那塊屏幕，向下拉。進入... 2023-07-07
科技怎麼恢複安卓手機删除的微信記錄
1、方法一：通過備份恢複：微信自己就有備份的功能，如果你在之前完成了備份，那就直接可以通過備份來恢複... 2023-07-07
科技硬金和軟金的區别
1、成分不同。硬黃金中摻雜有0.005%左右的特殊金屬，所以其硬度較高。軟黃金中黃金的含量很高，幾乎... 2023-07-07
科技驗證碼有什麼用
1、驗證碼的作用：有效防止這種問題對某一個特定注冊用戶用特定程序暴力破解方式進行不斷的登陸嘗試，實際... 2023-07-07
科技錄屏沒有聲音怎麼辦
1、打開手機自帶的系統工具。2、在系統工具中找到屏幕錄制。3、點擊右上角的設置按鈕。4、可以看到此時... 2023-07-07
科技用手機号碼定位找人
1、隻知道手機号碼就想定位找人，這種想法是不現實的，因為隻有運營商才能利用手機号定位人，這涉及個人隐... 2023-07-07
科技 apex怎麼顯示幀數和延遲
以華為MateBookX，win10，apex1.1.1為例：在遊戲中按ESC---設置。選擇遊戲設置---顯示性能參數，将該選項設置為開啟。返回遊戲界面，右上角已經顯示了了FPS和網絡延遲了。Apex：韓國Nexon子公司Symmetricspace開發的新款休閑射擊網遊《APEX》。《APEX》是一款休閑動作TPS，玩家可以體驗簡單、暢快的戰鬥。遊戲标榜“正面突擊”即固定正面視角，使初學者也可 2023-07-07
科技溫暖人心的唯美句子
1、出去走走，别讓壞情緒迷亂了世界，慌亂了心。2、一念天堂，一念地獄，快樂本由心決定，一如空氣存在，... 2023-07-07
科技電源鍵壞了怎麼開機
按别的鍵。1、首先、将手機徹底斷電，如果可以的話，最好取下電池如何再裝上;2、接着，按住音量-不放(... 2023-07-07

tft每日頭條

> 科技

> OCR在資産管理系統的應用

OCR在資産管理系統的應用

1. OCR 分類

2. OCR 算法理解

1. 核心場景

2. 業務流程

3. OCR 實現中的幾點考慮

4. 優化思路：批量處理

參考資料

相关科技资讯推荐

热门科技资讯推荐

网友关注