ANSI字符與字符的轉換
在電腦設計開始,為了能支持多國語言,使用兩個字節表示一個字符(可以這樣理解,兩個16進制的字節,表示一個漢字,比始中國的“中”在計算機真實存在就是 [0xD6,0xD0] 這兩個字節存儲。
每個國家又制定了不同的标準,由此産生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的編碼标準。這些使用多個字節來代表一個字符的各種漢字延伸編碼方式,稱為 ANSI 編碼。在簡體中文Windows操作系統中,ANSI 編碼代表 GB2312編碼;在繁體中文Windows操作系統中,ANSI編碼代表Big5;在日文Windows操作系統中,ANSI 編碼代表 JIS 編碼。
ANSI編碼作為中國以及部分亞太地區的多字符編碼格式,Windows系統和OS X都是提供原生支持的。
全球通用的是UTF-8編碼
windows系統默認是ANSI編碼,有時我們因輸入法,或從文本文件轉入EXCEL的會是亂碼;這需要轉換一下編碼格式:函數:code(); char()提供了簡單轉換;
比如:=code(b2)就是将b轉換成ANSI字符代碼98;
而=CHAR(66)則是得到大寫的B
最常見的是CSV文件用EXCEL打開,或文本文件導入EXCEL時出現亂碼,就是編碼問題造成的,批量轉的話可以直接用記事本打開,然後另存為,編碼那裡選ANSI格式就可以了;
我們做好的excel表格,可能會需要發送給其它國家或地區的人,那這裡要注意,對方收到有可能是亂碼;就是因為編碼格式不同;我們默認是ANSI,需要轉換成國際統用編碼,
其實也非常簡單,另存為時右下角有個工具下拉選 項(以2013版為例),選 web選 項;
然後出現對話框,我們再選擇 編碼項,找到Unicode(UTF-8)确定後回到另存界面,再保存就可以了;
這裡UTF-8編碼,unicode都是國際通用編碼,如果對方還亂碼,需要對方以他本地區編碼再轉換一下,從國際通用編碼方便轉換。
UTF-8是UNICODE的一種變長字符編碼又稱萬國碼,由Ken Thompson于1992年創建。現在已經标準化為RFC 3629。UTF-8用1到6個字節編碼UNICODE字符。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如日文,韓文)。
Unicode編碼
Unicode(統一碼、萬國碼、單一碼)是一種在計算機上使用的字符編碼。它為每種語言中的每個字符設定了統一并且唯一的二進制編碼,以滿足跨語言、跨平台進行文本轉換、處理的要求。1990年開始研發,1994年正式公布。随着計算機工作能力的增強,Unicode也在面世以來的十多年裡得到普及。
Unicode是國際組織制定的可以容納世界上所有文字和符号的字符編碼方案。Unicode用數字0-0x10FFFF來映射這些字符,最多可以容納1114112個字符,或者說有1114112個碼位。碼位就是可以分配給字符的數字。UTF-8、UTF-16、UTF-32都是将數字轉換到程序數據的編碼方案。
對了,小夥伴們覺得有用的話,請務必關注并收藏呀!後續大明哥持續不斷的為大家分享Excel中實用的知識點和技巧。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!