在所有IT項目中,漢字字符編碼帶來的問題是一個不小的工作量,經常導緻亂碼的發生。
快速查詢任意漢字的編碼能夠更快的定位錯誤。
糖果雲庫新增了漢字字符集庫,可查詢任意漢字的Unicode編碼,UTF8編碼,GB2312編碼,GBK編碼,查詢方法:
搜索糖果雲官網,在糖果雲庫中查找漢字字符集庫,打開即可任意查詢,查詢界面如下:
查詢任意漢字編碼
字符必須編碼後才能被計算機處理。計算機使用的缺省編碼方式就是計算機的内碼。早期的計算機使用7位的ASCII編碼,為了處理漢字,程序員設計了用于簡體中文的GB2312和用于繁體中文的big5。
GB2312(1980年)一共收錄了7445個字符,包括6763個漢字和682個其它符号。漢字區的内碼範圍高字節從B0-F7,低字節從A1-FE,占用的碼位是72*94=6768。其中有5個空位是D7FA-D7FE。
GB2312支持的漢字太少。1995年的漢字擴展規範GBK1.0收錄了21886個符号,它分為漢字區和圖形符号區。漢字區包括21003個字符。
Unicode也是一種字符編碼方法,不過它是由國際組織設計,可以容納全世界所有語言文字的編碼方案。UCS有兩種格式:UCS-2和UCS-4,UCS-2就是用兩個字節編碼,UCS-4就是用4個字節(實際上隻用了31位,最高位必須為0)編碼。最常用的是UCS-2,2個字節能容納65536個編碼。UCS-2有兩種表示方式:UTF8和UTF16,糖果雲查詢漢字的Unicode編碼即為UTF8,UTF16編碼。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!