tft每日頭條

 > 科技

 > 數據庫一個漢字占多少字節

數據庫一個漢字占多少字節

科技 更新时间:2024-06-17 02:41:55

1、oracle10g數據庫表字段為varchar(n)類型,存英文很簡單,隻要字母個數不大于n即可。

但是對于漢字,按照同樣的方法就不行了。因為對于漢字不同的字符集,

在數據庫占用的字節是不一樣的。

UTF-8字符集,一個漢字占三個字節,GBK字符集,一個漢字占兩個字節,

比如varchar(10)類型的字段,UTF-8的漢字,隻能存3個,gbk字符集的漢字卻能存5個。

所以在程序中根據表字段varchar的大小,保存或更新時作出必要的校驗否則後台會報錯。

2、辦法:1、用表格 maxlength屬性,比如maxlength=”5″,即隻能存5個漢字。

UTF-8:Unicode Transformation Format-8bit,允許含BOM,但通常不含BOM。

是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),

中文使用24位(三 個字節)來編碼。UTF-8包含全世界所有國家需要用到的字符,

是國際編碼,通用性強。UTF-8編碼的文字可以在各國支持UTF8字符集的浏覽器上顯示。

如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支持包。

GBK是 國家标準GB2312基礎上擴容後兼容GB2312的标準。

GBK的文字編碼是用雙字節來表示的,即不論中、英文字符均使用雙字節來表示,

為了區分中文, 将其最高位都設定成1。GBK包含全部中文字符,是國家編碼,

通用性比UTF8差,不過UTF8占用的數據庫比GBK大。

GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

3、對于一個網站、論壇來說,如果英文字符較多,則建議使用UTF-8節省空間。不過現在很多論壇的插件一般隻支持GBK。

GB2312是GBK的子集,GBK是GB18030的子集

GBK是包括中日韓字符的大字符集合

如果是中文的網站 推薦GB2312 GBK有時還是有點問題

為了避免所有亂碼問題,應該采用UTF-8,将來要支持國際化也非常方便

UTF-8可以看作是大字符集,它包含了大部分文字的編碼。

使用UTF-8的一個好處是其他地區的用戶(如香港台灣)無需安裝簡體中文支持就能正常觀看你的文字而不會出現亂碼。

gb2312是簡體中文的碼

gbk支持簡體中文及繁體中文

big5支持繁體中文

utf-8支持幾乎所有字符

4、MySQL 5.0以上的版本:

UTF-8:一個漢字=3個字節

GBK:一個漢字=2個字節

varchar(n)表示n個字符,無論漢字和英文,Mysql都能存入n個字符,僅是實際字節長度有所區别

5、MySQL檢查長度,可用SQL語言:

select LENGTH(fieldname) from tablename 來查看

數據庫一個漢字占多少字節(一個漢字在數據庫占幾個字節)1

數據庫一個漢字占多少字節(一個漢字在數據庫占幾個字節)2

數據庫一個漢字占多少字節(一個漢字在數據庫占幾個字節)3

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved