tft每日頭條

 > 知識

 > 漢字機内碼占幾個字節

漢字機内碼占幾個字節

知識 更新时间:2024-12-23 21:04:59

  一個漢字的機内碼占2個字節。因為漢字處理系統要保證中西文的兼容,當系統中同時存在ASCII碼和漢字國标碼時,将會産生二義性。

  計算機隻識别由0、1組成的代碼,ASCII碼是英文信息處理的标準編碼,漢字信息處理也必須有一個統一的标準編碼。漢字交換碼(國标碼)主要用于漢字信息交換,我國國家标準局于1981年5月頒布了《信息交換用漢字編碼字符集——基本集》,代号為GB2312-80,共對6763個漢字和682個圖形字符進行了編碼,其編碼原則為:漢字用兩個字節表示,原則上,兩個字節可以表示256×256=65536種不同的符号,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII西文字符編碼的關系,我國國家标準局采用了加以修正的兩字節漢字編碼方案,隻用了兩個字節的低7位。這個方案可以容納128×128=16384種不同的漢字,但為了與标準ASCII碼兼容,每個字節中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個字節隻能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关知識资讯推荐

热门知識资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved