文/IT可達鴨
圖/IT可達鴨、網絡
前言不知道大家在寫文章的時候,有無遇到簡體繁體轉化的問題。
今天給大家安利一款簡體繁體轉換的一個工具包,非常好用。
普通人的操作
一般,我們會用WPS進行簡繁體轉換。
選中文本,點擊“審閱”,就可以選擇“繁轉簡”或者“簡轉繁”。
如果老闆給你一百篇文章,甚至給你一千篇文章,需要簡繁體轉化,該怎麼做?
會編程的人
參照以往項目的風格,大家一定會知道,可以用編程實現批量處理。哪怕是一百萬篇文章,隻要一份代碼就能輕松松搞定。
我們來看看用到的核心python包,hanziconv
安裝命令: pip install hanziconv
調用示例:
from hanziconv import HanziConv
print(HanziConv.toSimplified('繁體轉簡體'))
print(HanziConv.toTraditional('簡體轉繁體'))
是的,三句命令,就能實現簡繁體互轉,非常簡單。
當然,要做到批量轉化,就編寫剩下的代碼。
和以往的批量處理項目一樣,采用OOP面向對象編程的思想對項目進行封裝。感興趣的朋友,可以翻翻我之前寫的系列文章,批量處理的框架學會了就能舉一反三。
那就讓我們開始寫代碼吧!
第一步,導入相關的python包,以及參數的配置。
第二步,類的初始化函數,并将hanziconv的兩個核心方法封裝成類的策略函數,用字典進行調用。
第三步,單個文本的處理函數,這裡使用txt讀寫文件,後續開發如果有需要可以換成其他格式的文本。
第四步,遞歸讀取文件,并逐個處理。
第五步:編寫類的主流程函數,這裡用到python的魔術方法__call__()的聲明方式,它的調用方式直接用對象後面加個括号即可。
第六步:主函數的編寫,創建對象,調用批量處理函數。
結果演示:左邊是簡體,右邊是繁體。
結語
批量簡繁體文章轉化的項目就開發好了,裡面還存在一些可以優化的地方。繁體字和簡體字除了寫法不同,其用法也不同,即同樣的意思,用簡體和繁體表達出來的詞卻不同。所以不能僅僅是簡體和繁體互換,而是考慮到情景等各方面因素,這塊就留給讀者去研究一下。
如果有疑問想獲取源碼,可以關注後,在後台私信我,回複:python簡繁體。 我把源碼發你。
學習python,不需要一杯奶茶錢,隻需要你點個關注。如果覺得小編的文章對你有幫助,記得點個贊,順便幫我分享出去。有什麼不明白的地方,歡迎在下方評論,或私信小編。最後,感謝大家的閱讀,祝大家生活愉快。
本文由 IT可達鴨 原創,歡迎關注,帶你一起長知識!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!