ocr怎麼設置自定義識别-tft每日頭條

ocr怎麼設置自定義識别

生活更新时间:2026-07-17 19:03:25

ocr怎麼設置自定義識别?很多人在聽到關于ocr轉譯的時候，大部分人認為這是一個關于圖片的标注前兩天我的同事跟我聊天的時候，說了一句OCR是圖片标注的一種，我問他為什麼，他說因為是圖片拉框的但是實際你知道嗎，ocr其實是屬于文本的，知道為什麼嗎？請跟着我的腳步一一為您揭開謎題，下面我們就來聊聊關于ocr怎麼設置自定義識别?接下來我們就一起去了解一下吧!

ocr怎麼設置自定義識别

很多人在聽到關于ocr轉譯的時候，大部分人認為這是一個關于圖片的标注。前兩天我的同事跟我聊天的時候，說了一句OCR是圖片标注的一種，我問他為什麼，他說因為是圖片拉框的。但是實際你知道嗎，ocr其實是屬于文本的，知道為什麼嗎？請跟着我的腳步一一為您揭開謎題。

一、什麼是OCR

OCR是什麼，英文：Optical Character Recognition，中文名稱：光學字符識别，簡稱OCR。它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來，并轉換成一種計算機能夠接受、人又可以理解的格式。比如：你想要将你看到某的一本雜志其中的一段文字内容複制出來，但是又不能複制，自己輸入又非常費時時，我們就可以通過OCR技術轉譯為文字了。

二、應用場景

目前OCR的應用可以分為四大場景

1. 拍照表單類

這一類的數據具有很大的私密性，通過我們的轉譯技術就可以保存為電子擋，但目前技術仍有難點。如：當前疫情期間，學生都是網絡授課，但是老師布置作業好多學生作業仍舊需要手寫作業，拍照給老師批改，但是我們的老師，一個一個的批改處理非常的耗時且電腦操作方面比較麻煩。所以當我們能夠通過OCR直接轉譯為文本就能解決非常大的問題，可以批量處理，直接給出結果。

2. 數字原生類

這一類數據是最為複雜多樣的：各種字體、背景、排列、組合等。而其中最具代表性的便是淘寶圖片了，這類圖片為商品信息的載體。圖片量大，每日更新也是最多的。

3. 文檔類

這一類數據涉及很多的公共場景，應用于如：車票、發票、外賣單、各類票據類别的存儲。

4. 自然場景

這一類目前是應用最廣泛、最成熟且商用價值最大的場景。如：證件識别、銀行卡識别、車牌識别、攝像監控、快遞單号識别等。

三、作為一個數據标注員我們可以做什麼？

1. OCR目前難點有哪些

1) 内容不規則、圖片清晰度等、背景幹擾等。

2) 非簡體字識别、相似文字、生僻字、複雜公式符号等

3) 定位問題粘粘明顯、行間距不清楚，難于标注、字高範圍

4) 手寫體問題是目前的主要難點，因為每個人的個人習慣字體風格均有不同，雖然我們自己能懂，但是機器卻很少能懂的。

5) 按照識别内容來說目前分為三大類：漢字、英文、阿拉伯數字。數字識别最簡單；英文識别僅有26個字母（算上大寫52個）；但是中文就不一樣了常用漢字3700、相似文字2278、以及繁簡體等，還需要識别出整個字體，是目前最大的難題。

2. OCR識别流程

版面分析 -> 預處理-> 行列切割 -> 字符識别 -> 後處理識别矯正

3. 我們可以做什麼？

通過上面内容我們可以了解到雖然現在有很多的行業已經在運用這一項技術了，但是目前仍舊有很多的技術難點，那麼要攻克這些難點就需要進行機器學習演練，而在在一個過程中則需要大量的數據支撐。所以這些大量的數據就是我們所需要做的了，采集、清洗、标注都是我們可以做的。

1) 采集：如手寫字體、廣告牌、學生作業、各類印刷體拍照收集

2) 清洗：去除無效數據、去除噪點數據、快速分類等

3) 标注：拉框、标簽、轉寫。

四、标注規則

關于ocr的标注規則，每一個ocr标注項目都有自己的規則，大體有如下規則：

1) 屬性标注：針對圖片分有效數據、無效數據等對整個圖片，或範圍内的标注

2) 框選要求：根據任務類型一般為拉框、多邊形等。

3) 精度要求：因為文字的像素基本在80-400之間，所以拉框精度，盡量貼合文字但是不要壓字體，根據不同的項目要求大體會有些許差異。

4) 内容轉寫：根據項目不同，可能為中文、英文、阿拉伯數字等，一般需要按實際内容轉寫。

5) 順序标注：很多OCR方面識别是按照順序來的，因為文本方面的内容一般都有連續性，如上下文這樣的，所以我們在做這一點的時候最好是按照内容順序标注。

6) 提交格式：現在技術基本是線上标注的方式，我們隻需要标注好了保存提交就可以了，但部分項目因為數據安全的問題，還是會采用線下标注的方式。提交格式需要根據項目要求提交如：json，txt等等

7) 溫馨提示：标注時無論線上、線下注意随時保存已标注内容，因為有時候沒保存就代表了做白工，還有重要的一點，标注時一定要好好的了解清楚标注工具性能還有一些快捷工具，畢竟磨刀不誤砍柴工嘛。

好啦，今天的分享就到此結束了，希望大家通過此文能對OCR有初步了解，關于數據标注你有想要知道的請告知小編喲。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活眼鏡防霧的竅門
眼鏡防霧的竅門：冬天從室外到室内，戴眼鏡的人總是會看不清東西，原因就是眼鏡上蒙了一層水汽，現在教你一個防止眼鏡起霧的竅門。步驟：1、将肥皂頭兒泡在溫水裡，做成肥皂水。2、将肥皂水均勻地塗抹在眼鏡片上。3、用眼鏡布輕輕擦幹淨即可。原理：因為肥皂含有油脂成分，将肥皂水塗抹在鏡片上，鏡片就不容易沾上水汽。... 2024-01-06
生活國考一般多少進面試？
國考每一年的考試情況不同，分數線也不同。近幾年一般115分以上可以進入面試，但一些競争較為激烈的部門需要150分以上才能進面試。國考全稱國家公務員考試，指中央、國家機關公務員考試，是國家部、委、署、總局招考在中央國家機關的工作人員的一種方式。國家公務員考試招考條件相對比較苛刻、嚴格，一般均要求全日制... 2024-01-06
生活美麗動人指甲油的12種妙用
指甲油又稱“指甲漆”。它主要成分為70%-80%的揮發性溶劑，15%左右的硝化纖維素，少量的油性溶劑、樟腦、钛白粉以及油溶顔料等。指甲油塗于指甲後所形成的薄膜，堅牢而具有适度着色的光澤，即可保護指甲，又賦予指甲一種美感。美麗動人指甲油的12種妙用指甲油不僅能讓你的指甲美麗動人... 2024-01-06
生活打麻将有哪些技巧
打麻将是一種娛樂大衆的活動，很多朋友都會，隻是每個地方的方法略有不同，但是規則大緻都是一樣的，很多人都會在休息的時候約上好朋友或者家人一起在家玩玩麻将，不僅能讓家人朋友團聚，親近，也會在相聚的同時多了很多的樂趣。在娛樂時候，很多人就會想動動腦子，了解一下打麻将的技巧，讓這個遊戲更加的豐富一下，還能鍛... 2024-01-06
生活保持衣物的光潔鮮豔需要做到這三點
随着現代社會的不斷發展，洗滌行業的技術也在革新，一些具備超強去污能力的洗滌産品也漸漸湧向市場，消滅日常頑漬自然不在話下。保持衣物的光潔鮮豔需要做到這三點秘訣1：不但潔淨也要護手衣服要潔淨，但是手的保護也很重要。時尚優雅的都市麗人，無論是工作和生活都呈現出最靓麗的一面。除了美麗的造型，作為女性第二張臉... 2024-01-06
生活實木地闆養護法則讓地闆在春季也容光煥...
春季氣溫走高，室内溫度與濕度的變化随時都可能引發地闆、家具幹縮、開裂的現象。一些實木地闆養護法則能讓地闆在春季也容光煥發。下面就跟随作文庫知識百科了解一下吧！實木地闆的保養三法則一：地闆打蠟次數不宜頻繁春季天氣幹燥，尤其是目前室内仍有暖氣，輕易導緻居室内空氣更加幹燥，為了讓地闆“皮膚&r... 2024-01-06
生活衣服混洗會導緻一件事
現在基每一個家庭裡面都是會有洗衣機的，所以大部分的人不再會用手洗衣服的，基本上都是把所有的衣服往洗衣機裡面一扔，然後就開始自動洗滌了，那您知道衣服混洗會人體交叉感染嗎？您知道服裝洗滌應按類分開的原因是什麼嗎？今天就為您介紹一下有關洗衣服的注意事項的知識，感興趣的朋友們趕快來看看啊。衣服混洗會人體交叉... 2024-01-06
生活預防酒醉傷肝髒，小小妙招先行
解酒的最快方法是什麼？告訴你，吃下面的這些水果就能夠解酒。當我們在酒店用餐接近尾聲時，通常會遇到這樣的情境：服務員會給就餐者端上一碟水果，那就是讓客人用來解酒醒酒的。這可是解酒的最快方法哦！預防酒醉傷肝髒，小小妙招先行酒精一般在胃裡就會被血液帶進循環系統，當肝髒解酒速度弱于酒精攝入速度的時候，血液酒... 2024-01-06
生活内褲正面曬還是反面曬好
内褲者，又稱底褲，遮羞護私之衣片。無論三角、四角、镂空、線式……不過為輕薄一布也。然，這小小“布片”衛生與否卻與健康有大關系！據統計，六成以上的婦科炎症就是這内褲“惹”來的！那麼，健康用内褲有什麼講究呢？本期寡人就以“如何曬内褲更健康”來糾結一哈子……曬内褲最好是做“日光浴”所謂“曬内褲”，就是要讓... 2024-01-06
生活不同面料衣服怎樣晾曬？
服裝洗好後，總的晾曬原則是：應根據不同質料、不同顔色采取不同的晾曬方法。【1】絲綢服裝：洗好後要放在陰涼通風處自然晾幹，并且最好反面朝外。因為絲綢類服裝耐日光性能差，所以不能在陽光下直接曝曬，否則會引起織物褪色，強度下降。顔色較深或色彩較鮮豔的服裝尤其要注意這一點。另外，切忌用火烘烤絲綢服裝。【2】... 2024-01-06
生活冰島古樹茶多少錢一斤？
01不同類型的冰島古樹茶的價格會有很大的差異，有的時候甚至會相差好幾倍，最貴的要算500年的古樹茶，隻有這樣的古樹茶才能值萬元每公斤。100年以上的古樹茶葉可以達到8000元/公斤，而當地台地茶也已經超過2000元/公斤。冰島古樹茶多少錢一斤會根據不同的産地不同的類型來定義，2021年基本都在幾千塊... 2024-01-06
生活田螺吃什麼
田螺含有蛋白質和鈣，而且做成麻辣田螺的話，口味也是非常棒的，因此很多朋友都非常喜歡吃田螺。但是有一些報道說田螺都是在污水中長大的，如果是食用之後會給身體帶來一定的危害，因此很多朋友都想要好好的了解一下田螺吃什麼，看看它是否真的是不能吃的食物。想要知道田螺吃什麼，就要知道它的生活環境，一般田螺都是生存... 2024-01-06
生活菜籽出油率
我們的飲食中都離不開油鹽醬醋，這些看似簡單的食材，在制作起來，卻有着非常複雜的工藝。我們常吃的食用油有大豆油、花生油、玉米油等等。這些油的價格不一，除了與原料的成本有關系之外，還與菜籽的出油率有關系。要想使得菜籽出油率高，就要從選材開始。了解不同種子的特征，有利于更好地控制制作過程中的一些溫度等調節... 2024-01-06
生活地漏反味怎麼辦？地漏如何防臭
地漏反味怎麼辦？1、及時的往地漏中灌水，使地漏中的水封保持，并時常更換;2、盡管自封地漏是地漏未來必然的發展趨勢，可是就目前實際情況而言，其防臭效果還不如水封地漏穩定，因此還是盡量選擇水封地漏。3、用塑料袋裝水。可以拿一個密封好的方便袋，袋子裡裝上清水把口系好，然後把裝水的方便袋放到地漏口上面，用的... 2024-01-06
生活家庭常用的消毒方法
為确保家庭成員的身體健康，下面介紹常用的家庭簡易消毒的方法：【1】食具與砧闆的消毒食具一般用沸水煮15～20分鐘，或用84消毒液浸泡30分鐘。【2】衣物與被褥的消毒對化纖衣物，可用0.1%的84消毒液浸泡60分鐘，也可用2%至5%來蘇爾液浸泡1～2小時，然後用清水洗淨。對于皮革及絲織物，可用福爾馬林... 2024-01-06
生活西服保養知識：保養西服有絕招
穿上一套高質量的西服，會使穿着者看上去英俊潇灑、溫文爾雅。然而，西服是要靠精心養護的。隻有保養得當，才能使西服長久保持原有的形态和品質。【1】要經常清刷西服灰塵是西服的最大敵人，西服粘上灰塵，會使西服失去清新感，故需要常用刷子輕輕刷去塵土，有時西服沾染上其他的纖維或較不容易除去的塵埃，可以用膠帶紙加... 2024-01-06
生活紅木家具的保養
紅木家具因其華美的外形，以及不菲的收藏價值而備受消費者的青睐。而紅木家具養護也頗有講究，首選的養護劑就是核桃油。“因為紅木質地上乘、工藝傳統精緻、表面塗層主要為蠟和天然生漆，所以應該用天然油脂——核桃油來保養。”核桃油是一種很好的養護劑，由核桃仁加工制... 2024-01-06
生活白色絲綢泛黃怎麼辦？白絲綢泛黃的去除
1、局部的黃色汗漬，可用鮮冬瓜片抹拭污處，冬瓜汁液可将黃漬除去，然後用清水漂淨。2、大面積泛黃的衣物，可浸在淘洗大米的淘米水中，每天換一次淘米水，大約3天後，黃漬即可脫淨，最後用清水漂洗幹淨即可。注意不能帶色的淘米水浸泡，防止着色。3、泛黃的絲綢衣物還可以用檸檬汁漂洗，或用淡檸檬酸漂洗，都可将黃漬去... 2024-01-06
生活什麼人不能吃紅桃k？
01胃酸過多平時那些胃酸過多的人群不能食用，另外紅桃k還能很強的利尿作用，腎功能不全的人群也要盡量少用紅桃k。紅桃k果雖然有多種保健功效，但是這種植物果實中含有大量的有機酸。胃酸過多的人群不能食用紅桃k，腎功能不全的人群也要盡量少用紅桃k。紅桃k，學名為玫瑰茄，又名洛花神、烙花神、烙神花、洛神花等。... 2024-01-06
生活養護小訣竅巧妙保養各種廚房台面
家居生活中，櫥櫃的使用頻率比家具還要高。購買定制櫥櫃的消費者經常反映，櫥櫃台面容易接觸污漬油漬，且部分櫥櫃台面的材質在遇熱或碰撞中容易變形或破裂。對于這種必不可少的廚房家具，日常生活中需要恰當地使用和保養。養護小訣竅巧妙保養各種廚房台面那麼，各種廚房台面要如何保養呢？人造石台面：避免受力不均優點：人... 2024-01-06
生活衣服總變黃？恢複潔白亮麗有辦法！
衣服上我們經常會不小心滴到各種各樣的污漬，但是去除的方法卻不多，有時候一件很漂亮的衣服因為某快明顯的污漬而不得不束之高閣，小編為大家找了些除掉各種污漬的方法希望對大家有用。衣服總變黃？恢複潔白亮麗有辦法！衣服會變黃，多半是熒光劑變弱所緻，想要衣物恢複潔白亮麗，就得想法子。1、洗米水+橘子皮簡單又有效... 2024-01-06
生活菠菜水使黑色針織衣物增黑
黑色的針織衣物可是很多朋友衣櫃中最常見的。可是穿久後，顔色就沒那麼深了，這裡告訴你一個讓黑色針織衣物增黑的竅門。試試它吧——菠菜水！就是燙過菠菜剩下的水。用一條黑色針織褲做個實驗。先将黑褲子放入盆中，然後将菠菜水倒入盆中，浸泡三分鐘，然後用手将褲子揉洗一會，再浸泡三分鐘，然後... 2024-01-06
生活如何選購保暖内衣？四步正确選購保暖内...
消費者應該如何挑選保暖内衣呢？其實，消費者選購保暖内衣要分四步，即“看面料”、“聽聲音”、“憑手感”以及“試彈性”。一是看面料。目前市場上的保暖内衣可按高、中、低檔三類來分，其使用的面料有40支全棉、32... 2024-01-06
生活不能用舊衣服擦家具
擦拭家具時，不要用粗布或者不再穿的舊衣服當抹布。最好用毛巾、棉布、棉織品或者法蘭絨布等吸水性好的布料來擦家具。粗布、有線頭的布或有縫線、鈕扣等會引起家具表面刮傷的舊衣服，就應盡量避免使用。不要用幹抹布擦拭家具表面的灰塵。灰塵是由纖維、砂土和矽土構成的，很多人習慣用幹的抹布來清潔擦拭家具表面。其實這些... 2024-01-06
生活開關、插座、燈罩清潔
電燈開關上留下手印痕迹，用橡皮一擦，即可幹淨如新。插座上如果沾染了污垢，可先拔下電源，然後用軟布蘸少許去污粉擦拭。清潔帶有皺紋的布制燈罩時，用一種毛頭較軟的牙刷做工具，不易傷燈罩。清潔用丙烯制的燈罩，可抹上洗滌劑，再用水洗去洗滌劑，然後擦幹。普通燈泡用鹽水擦拭即可。 2024-01-06
生活吸盤挂鈎總是掉怎麼辦？生活妙招教給你
吸盤挂鈎總是掉怎麼辦？生活妙招教給你吸盤挂鈎總是掉怎麼辦？1、水：最常用的方法是在吸盤挂鈎粘牆面之前先沾點水在挂鈎背面上，然後迅速粘到牆面上。這種方式雖然會比沒有沾水好一點，但效果仍然不是很理想。2、肥皂水：需要效果更好的可以用肥皂水，同樣也是把肥皂水塗抹在吸盤挂鈎背面，然後迅速粘到牆面上，待幹透了... 2024-01-06
生活窗簾根本不用拆下來洗不同材質的窗簾不...
日常生活中我們清洗窗簾時，經常需要拆下來清洗，今天作文庫知識百科教大家一個小竅門，窗簾不用拆下來也能清洗，下面一起來了解一下吧。我們先準備一個噴壺，然後再往噴壺裡倒入少許的洗衣液，接着再倒入少許的洗潔精，然後再倒入少許的白醋，添加白醋之後再滴入幾滴花露水，最後倒入清水，搖晃均勻。搖晃均勻後，将窗簾噴... 2024-01-06
生活各種清潔技巧與你分享
各種清潔技巧與你分享各種清潔技巧與你分享1、柚木地闆一旦被水浸，會出現膨脹開裂及彎曲現象，清潔時候，隻需用較濕的抹布擦一下，然後即可用布抹幹就行了，如要保持地闆光亮，可定期打蠟。2、水泥及磨石地闆，可用尼龍刷子沾上清潔劑或肥皂水刷一遍即可。3、瓷磚地打蠟便可保持光亮，但用水清潔後要确保地面幹爽，以免... 2024-01-06
生活怎樣正确清洗内衣内褲？
有時候花了不少錢買的文胸、内褲。但洗過以後出現變形，或出現别的問題。再穿起來就不舒服了。花的錢是不是很心痛呢？下面作文庫知識百科整理的怎麼洗内衣和内褲，以供大家參考。1、盡量用手洗内衣内褲、不用洗衣機、甩幹機盡量用手洗，不用洗衣機，甩幹機，否則文胸肩帶或其他細部分易受拉扯，而且内衣上細緻的蕾絲也容易... 2024-01-06
生活怎麼避免沙發碰損牆壁
沙發一般都靠牆放置，容易使牆壁留下一條條傷痕。隻要在沙發椅的後腳上加一條長方形的木棒，抵住牆腳，使椅背不能靠上牆壁，就可避免沙發碰損牆壁了。 2024-01-06

tft每日頭條

> 生活

> ocr怎麼設置自定義識别

ocr怎麼設置自定義識别

ocr怎麼設置自定義識别

相关生活资讯推荐

热门生活资讯推荐

网友关注