tft每日頭條

 > 科技

 > ascii編碼怎麼轉換成utf

ascii編碼怎麼轉換成utf

科技 更新时间:2024-06-28 05:31:51

什麼是字符編碼?

計算機隻能處理數字,如果要處理文本,就必須先把文本轉換為數字才能處理。最早的計算機在設計時采用8個比特(bit)作為一個字節(byte),所以,一個字節能表示的最大的整數就是255(二進制11111111=十進制255),如果要表示更大的整數,就必須用更多的字節。比如兩個字節可以表示的最大整數是65535,4個字節可以表示的最大整數是4294967295。

ascii編碼:

由于計算機是美國人發明的,因此,最早隻有127個字母被編碼到計算機裡,也就是大小寫英文字母、數字和一些符号,這個編碼表被稱為ASCII編碼,比如大寫字母 A 的編碼是65,小寫字母 z 的編碼是122。

但是要處理中文顯然一個字節是不夠的,至少需要兩個字節,而且還不能和ASCII編碼沖突,所以,中國制定了GB2312編碼,用來把中文編進去。

全世界有上百種語言,日本把日文編到Shift_JIS裡,韓國把韓文編到Euc-kr裡,各國有各國的标準,就會不可避免地出現沖突,結果就是,在多語言混合的文本中,顯示出來會有亂碼。

unicode編碼:

從上面的表格可以發現UTF-8編碼一個額外的好處,就是ASCII編碼實際上可以被看成是UTF-8編碼的一部分,所以,大量隻支持ASCII編碼的曆史遺留軟件可以在UTF-8編碼下繼續工作。

謝謝清香白蓮素還真的點評,強調一下,unicode是一種編碼方式,和ascii是同一個概念,而UTF-8,UTF-16等是一種存儲方式,在存儲和傳輸上節約空間、提高性能的一種編碼形式。

計算機系統通用的字符編碼工作方式:

在計算機内存中,統一使用Unicode編碼,當需要保存到硬盤或者需要傳輸的時候,就轉換為UTF-8編碼。

用記事本編輯的時候,從文件讀取的UTF-8字符被轉換為Unicode字符到内存裡,編輯完成後,保存的時候再把Unicode轉換為UTF-8保存到文件:

ascii編碼怎麼轉換成utf(三種常見字符編碼)1

浏覽網頁的時候,服務器會把動态生成的Unicode内容轉換為UTF-8再傳輸到浏覽器:

ascii編碼怎麼轉換成utf(三種常見字符編碼)2

所以很多網頁的源碼上會有類似<meta charset="UTF-8" />的信息,表示該網頁正是用的UTF-8編碼。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved