tft每日頭條

 > 科技

 > ocr技術基本模塊

ocr技術基本模塊

科技 更新时间:2024-12-02 18:34:43

ocr技術基本模塊(Linux平台的OCR軟件gImageReader)1


簡介:gImageReader是一個GUI軟件,實現利用tesseract OCR引擎(Tesseract本身是命令行工具)從Linux中的圖像和PDF文檔中識别文本。

ocr技術基本模塊(Linux平台的OCR軟件gImageReader)2

概述

Tesseract最初是由惠普開發的,然後在2006年開源。你可以用OCR(光學字符識别)引擎掃描圖片或文件(PDF)中的文本。默認情況下,它可以檢測多種語言,并且還支持通過Unicode字符進行掃描。

gImageReader特性
  • 從磁盤,掃描設備,剪貼闆和屏幕截圖添加PDF文檔和圖像
  • 支持多頁的 PDF 文檔
  • 自動分頁檢測
  • 通用圖像控件可調節亮度,對比度和分辨率
  • 能夠一次處理多個圖像或文件
  • 支持用戶手動定義和調整識别區域(也可以自動識别文字區域)
  • 識别純文本或hOCR文檔
  • 可以提取的文本進行對拼寫檢查
  • 可以從hOCR文檔轉換/導出為PDF文檔
  • 将提取的文本導出為.txt文件
  • 可以識别不同的語言
  • 跨平台
  • ... ...
軟件安裝

1.由于不知道gImageReader在軟件倉庫中的确切名字,終端輸入以下命令進行查詢,發現有多個版本,我安裝的Qt版本。

sudo pacman -Ss gImageReader

ocr技術基本模塊(Linux平台的OCR軟件gImageReader)3

2.終端輸入以下命令進行安裝

sudo pacman -S gImageReader-qt

3.安裝完成出現如下圖标表示安裝成功。

ocr技術基本模塊(Linux平台的OCR軟件gImageReader)4

4.安裝OCR引擎,執行以下命令

sudo pacman -S tesseract-data-eng tesseract-data-chi_sim #安裝的tesseract-data-eng用于識别英文 #安裝的tesseract-data-chi_sim用于識别簡體中文

簡單使用

一、打開軟件出現如下界面

ocr技術基本模塊(Linux平台的OCR軟件gImageReader)5

上圖中:

1處用來加載待識别的圖片

2處用來選擇圖片中的識别區域

3處用來切換識别文字的語種,可以識别漢語、英語、英漢混合

4處用來顯示識别結果

二、下圖為識别效果圖,更多功能自行探索。

ocr技術基本模塊(Linux平台的OCR軟件gImageReader)6

番外篇

ocr技術基本模塊(Linux平台的OCR軟件gImageReader)7

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved