上一篇說到python的設置默認編碼格式,然後站長發現居然沒有寫編碼轉換!在這裡站長決定補回來。
編碼轉換是什麼意思?意思也就是原先是utf-8編碼的文件用代碼轉換成GBK。
就好像我們設定了一個采集是吧,然後采集回來發現是亂碼,我們可以用笨辦法,先去被采集的網站看看他的編碼格式,然後再看我們默認的編碼格式,對的話就看看是不是别的問題,如果不對應,那肯定是編碼問題,那麼我們就要增加一個轉換機制,如下圖:
在這個圖裡面站長是把原先是正常文字的字符串轉換成了GBK所以才會這樣,如果你原先是以GBK格式采集到的字符串,你的文件編碼格式偏偏是UTF8,那麼就會出錯,變成一堆Unicode編碼,這時候你隻需要換個編碼格式轉換一下,輸出之後就是正常的。
對了,注意看圖裡那個方法了沒?encode方法就是專門用來轉換格式用的,接下來還有一個統計某一個字符的出現次數的方法。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!