有的同學居然不知道OCR,這點小事還得老問。
OCR是Optical Character Recognization的縮寫。我們一般手上的掃描文獻可能是圖形轉變為PDF文檔的,這類文件最大的問題就是不能用關鍵詞檢索文檔裡面的内容。你必須使用正版PDF工具所帶的OCR功能識别這個文獻的文字,把圖形上面的文字識别出來,這洋就能檢索了。
當然,OCR也不是完全準确的,但目前的識别水平,大多數文字都能正确識别。目前國産軟件福昕編輯器就是不錯的PDF工具,注冊也不貴,大約1-2百塊錢一年,外國的工具可就很貴了,估計五六百或者上千,不必要。
還當然,不是絕對必要不主張掃描别人的文獻,都掃描了,電子分享了,作者也就得餓死了,我們就再也沒有優秀文獻參考了。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!