通俗的講什麼是unicode-tft每日頭條

通俗的講什麼是unicode

圖文更新时间:2026-07-11 13:06:16

無論是用Python還是其它語言，處理字符編碼都是一件極其痛苦的事情。我們無法忘記被UnicodeDecodeError和UnicodeEncodeError支配的恐懼。本文将以Python3為例，帶你了解Unicode的基本概念，以及字符串編碼解碼的工作原理，讓你從根本上理解字符編碼。

首先，我們來看一看什麼是字符編碼。我們知道，計算機裡所有的信息都是以數字的形式來表示的，字符也不例外。要想表示一個字符，首先要把它轉換成對應的數字。

最簡單的字符編碼就是大家耳熟能詳的ASCII碼。ASCII碼能夠表示127個字符，它們包括：大寫字母，小寫字母，标點符号，空格和一些非打印字符。每一個字符都對應一個代碼點（code point）。我們可以認為一個代碼點就是一個整數。ASCII碼中包含的字符和它們對應的代碼點範圍如下：

通俗的講什麼是unicode（看這一篇就夠了）1

整個ASCII表包含128個字符。沒有出在這張表裡的字符無法用ASCII編碼來表示。

Python的string模塊裡定義了完整的ASCII字符集

通俗的講什麼是unicode（看這一篇就夠了）2

我們可以在代碼中直接引用這些常量

通俗的講什麼是unicode（看這一篇就夠了）3

ASCII編碼非常簡單，而且能夠表示所有英文字母和常見符号。但是這樣就夠了嗎？當然不是。如果我們想在計算機中表示一個漢字或者想要表示一個日語的假名該怎麼辦？很顯然，隻有128個字符的ASCII碼是遠遠不夠的。這就是Unicode産生的原因。

其實，Unicode和ASCII碼的目的是一樣的，隻不過Unicode所包含的字符要遠遠多于ASCII碼。事實上，Unicode最多可以容納1,114,112個code point。把世界上所有語言的文字和符号加起來應該也夠用了。比如說漢字“我”在Unicode中的編号是6211。為了與ASCII碼兼容，Unicode規定，前128個字符與ASCII碼是相同的。所以一個不大于128的code point所代表的Unicode字符與ASCII碼相同，而超過128的字符則為ASCII無法表示的。

由于Unicode的字符集太過龐大，因此，它無法像ASCII碼一樣，用一個字節就可以表示。所以，Unicode勢必要用多于一個字節來表示一個字符。這時就遇到一個問題，那就是在計算機進行讀取的時候，它怎麼知道那幾個字節是屬于一個字符的呢？比如，有一串字節數據“0xaa 0xbb 0xcc 0xdd 0xff”，我們怎麼知道哪幾個字節組合在一起來表示一個字符呢？那麼就需要一種約定，來告訴我們如何把code point轉換成字節流，或者反過來。這就是編碼和解碼。

既然是約定，那就意味着可以用不同的方法。事實上，最常用的編碼方式是UTF-8，除此之外還有UTF-16，UTF-32等。由于篇幅有限，這裡就不再展開每種編碼的具體細節了。大家隻需要知道，不管是什麼編碼，他們都是用來實現一個code point和一串字節流之間的轉換的。

在Python3中，str類型可以用來存儲可讀的Unicode文本，而bytes則用來存儲二進制數據。字符串編碼和解碼的過程就像這樣

通俗的講什麼是unicode（看這一篇就夠了）4

例如：

通俗的講什麼是unicode（看這一篇就夠了）5

這裡，str.encode()的輸出是一個bytes對象，其中保存了Unicode字符串編碼後的字節流。

這裡要注意的是，要想正确地對編碼數據進行解碼，必須使用匹配的編解碼方法，否則解碼的數據就會使錯誤的，比如下面這個例子：

通俗的講什麼是unicode（看這一篇就夠了）6

可以看到，我們編碼的數據是一串希臘字母，但是由于解碼用的方法和編碼不一緻，所以接出來的居然是一串韓文字符，錯得有點離譜了。

總結

Unicode實際上就是一個巨大的字符集，裡面保存着所有人類已知的文字和字符；
每一個Unicode都對應一個code point；
編碼是把code point轉換成字節流的過程，而解碼是把字節流轉換成code point的過程；
編碼的方法有很多種，最常見的是UTF-8，這也是Python3默認的編碼方式；
編解碼方式必須要一緻，否則就會導緻解碼結果錯誤。

關注我，更多精彩文章！

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文何謂治風先治血血行風自滅
粉絲朋友，今天我給大家說上一病，這就是稍微上了年紀的人，或者女性，常常出現的手腳發麻、渾身竄痛的問題。此病，到醫院檢查，往往别診斷為風濕、類風濕。說起來，風濕也好，類風濕也好，它們統統歸屬于中醫學的“痹症”範疇。痹症的形成原因多種多樣。我們... 2023-01-10
圖文怎樣搭配書桌
但凡能擺個桌子有點地方，大家都有把東西收拾收拾弄個漂亮桌面的想法。但理想總是很豐滿，現實一直很骨感，大部分人對于怎麼收拾桌子根本就無從下手。筆者根據自己的布置經驗，來給大家說說要注意的幾個點。1.桌面結構拓撲設備拓撲還請見圖，具體内容在下面... 2022-12-04
圖文最新飯局事件
“證券圈飯局不雅視頻”事件日前成了網絡熱點，主角為某證券分析師馬某及其下屬廖某等人。視頻中，美女分析師廖某與劉某某疑有不雅動作。視頻曝光後，主角馬某被取消參評新财富最佳分析師資格，涉事證券公司也宣布對馬某、廖某進行調查。而對是否該将這個證券... 2022-12-28
圖文蜂蜜祛斑最有效的祛斑土方法
面膜祛斑法一、桃花蜂蜜祛斑面膜材料：幹桃花20G、冬瓜仁15G、蜂蜜适量制作妙招：将幹桃花與冬瓜仁放入一起研碎成極細的粉末，然後再加入适量的蜂蜜，放入容器裡一起攪拌調稀狀，以才能敷于面上不掉為準。運用妙招：行将臉部清潔幹淨，再用毛巾浸熱水敷... 2023-01-01
圖文雪花的形成特征
KennethLibbrecht有一項宏偉的計劃——在這個寒冷的冬季，離開溫暖宜人的南加州，前往位于阿拉斯加的費爾班克斯。那裡冬季氣溫幾乎始終低于冰點，他穿上厚厚的派克大衣，捧着照相機外加一塊泡沫闆，席地而坐，靜候天降大雪。他在這裡等待的，... 2022-11-27
圖文成考和自考哪個要簡單些
成人高考和自考都是我國成人教育的一種形式，都是國家承認的真實有效的學曆，取得的學曆均可在學信網上查到，都可用于考研、考公務員、考證、崗位晉升、出國留學等等。但是很多考生都不太了解成考（成人高考）和自考（自學考試）究竟有什麼區别、應該選哪一個... 2023-01-01
圖文 mac夏天最值得入手色号
MAC，一直都是很多女生的心頭愛，因為不僅色号齊全，而且相對于大牌的口紅價格來說，性價比更高，更能夠滿足女生的綜合需求，甚至很多女生看見mac出現新色号的時候，根本不加思考，就選擇入手，然而mac真的有那麼完美嗎？實際上并不然，踩雷色号也很... 2023-03-09
圖文五裡墩街道志願巡邏
席先祥（前排）和志願者一起義務巡邏。紅網時刻10月26日訊（通訊員曠昆紅）10月20日晚7點20分，天色已暗，細雨中夾着寒風，路上行人少了些。吃過晚飯，公交車司機席先祥轉換了身份，作為株洲市天元區嵩山路街道韶溪社區志願者服務隊隊長，他拿上巡... 2022-11-04
圖文藜麥都有啥營養
說起大麥、小麥我想大家都比較熟悉，但是提起藜麥我想大家就比較陌生了吧！藜麥原産于南美洲的玻利維亞、厄瓜多爾和秘魯，被印加土著民族食用和種植已有5000到7000年的時間了，相傳藜麥是神的食物，因此也被古代印加人稱之為“糧食之母”。三色藜麥N... 2023-02-02
圖文 p圖大神惡搞新圖
如果你想讓大神幫你P圖，那你要做好思想準備，因為，大神可能給你P成以下這個樣子。神級PS圖片！求P需謹慎…一大波搞笑神PS圖撲面而來求大神給我換個背景，熱鬧一點的看看，熱鬧吧，挨揍快跑吧老哥，你現在比你兒子還萌啦幫我P出窮遊的感覺……你這也... 2023-03-13
圖文落戶天津這間魯迅當年
落戶天津這間魯迅當年?7月10日，内山書店落戶天津發布會舉行内山書店将于7月11日正式與天津市民見面，現在小編就來說說關于落戶天津這間魯迅當年?下面内容希望能幫助到你，我們來一起看看吧!落戶天津這間魯迅當年7月10日，内山書店落戶天津發布會... 2022-10-12
圖文申請失業保險金流程
申請失業保險金流程?近期較多市民對失業保險金的申請條件及渠道的咨詢量有所增多，今天，小編帶您一起來了解下，接下來我們就來聊聊關于申請失業保險金流程?以下内容大家不妨參考一二希望能幫到您!申請失業保險金流程近期較多市民對失業保險金的申請條件及... 2022-11-25
圖文床單上很久的血漬怎麼能洗幹淨
日常生活中難免會有流血的時候，有時候就會沾在床單被罩或者衣服上，特别對于女性朋友們，這種情況會更多發生。如果不及時進行清理的話，等到血漬幹了之後，就會變得非常難清理，相信大家都遇到過這種事情，今天給大家分享一個小妙招，非常輕松就能把床單衣服... 2022-11-10
圖文三年級數學第八單元知識點整理
第一第二課時，萬以内數的讀法、寫法哪個數位上（最高位）除外，一個計數單位也沒有，就在哪個數位上寫零占位。第3課時認識一萬十個一千是一萬第4課時萬以内數的比較1、先比較位數，位數多的數就大。2、位數相同時，從最高位比起，最高位上的數大的那個數... 2023-01-16
圖文小孩怎麼樣才是内八
小孩怎麼樣才是内八?内項性格的孩子相對比較敏感，越是強迫他外向越讓他感到恐懼，他們有自己的優點，那就是善于思考，做事缜密，隻有在非常輕松的氛圍裡他們才會展現自我的長處，所以如果想讓内項性格的孩子發揮最大的優勢，應該這樣做，現在小編就來說說關... 2022-12-24
圖文皮克桃下飯者
說起皮克桃相信王者榮耀的小夥伴們都是十分熟悉了，作為KS王者直播的頭部主播，她的特點就是菜到了極緻，連三龍王夢淚、四個職業選手都曾帶不動她慘敗，也因此有峽谷鬼見愁之稱。不過當皮克桃突然轉變風格走起“茶藝女”路線時，網友們看後也是紛紛直呼内行... 2023-03-18
圖文街道辦事處自助服務區
“這回更方便了！申報材料信息不會填、填不準，視頻指南全教會。”近日，沈陽市鐵西區一家企業負責人在感受到“辦事神器”動畫片的“魔力”後連連感概。記者了解到，為大力推進政務服務智能化改革，方便企業和群衆辦事，鐵西區營商局以服務需求為導向，在原有... 2023-01-16
圖文阿瑪尼紅氣墊裸妝選擇什麼色
阿瑪尼紅氣墊裸妝選擇什麼色?，我來為大家講解一下關于阿瑪尼紅氣墊裸妝選擇什麼色?跟着小編一起來看一看吧!阿瑪尼紅氣墊裸妝選擇什麼色光澤保濕又遮瑕的底妝單品推薦——阿瑪尼紅氣墊久仰大名的阿瑪尼紅氣墊，有着簡約而高大上的外包裝，是絕佳的時尚單品... 2023-03-15
圖文護工管理辦法最新
護工管理辦法最新?來源：人民網-觀點頻道原創稿，今天小編就來說說關于護工管理辦法最新?下面更多詳細答案一起來看看吧!護工管理辦法最新來源：人民網-觀點頻道原創稿“看着姥姥兩條胳膊上青一塊紫一塊，我們全家人都很憤怒。”據《法制日報》報道，近日... 2023-02-28
圖文想念一紙相思的句子
想念一紙相思的句子?一念相思起，心裡樂翻天，此樂不是形容愉快，而是多愁善感的心緒，想你，一抹相思意百轉千回情，想念就是如此盲目!，今天小編就來說說關于想念一紙相思的句子?下面更多詳細答案一起來看看吧!想念一紙相思的句子真愛，需要耗盡一生的溫... 2022-10-14
圖文注冊時所用的電子郵件地址
原作：保坂浩紀，《UXデザインのやさしい教本》主編；翻譯：@十早Hanc在開始文章之前，先了解一下本文的大體内容：從以前就很在意，有時在注冊某些産品後，會收到發件人為“noreply@xxx”的确認郵件。“noreply”用日語來講就是“不... 2023-03-07
圖文衢州市城市交通規劃圖
現有雙向四車道的320國道（衢龍公路）作為衢江至龍遊唯一主要通道，随着多式聯運樞紐港的建設發展，該路段的交通量将進一步增加，因此該段320國道的改建已十分迫切。是的！這不，320國道（衢龍公路）将南移，改造成雙向六車道。今天就帶你全方位了解... 2022-10-29
圖文克拉克斯頓增肌前後對比
在生活當中，或許有很多人都知道“摔角”這個詞，但其中有些人并不知道WWE。他們了解摔角，是通過另一位人物——比利·海靈頓！畢竟這是一個流傳于表情包世界的摔跤之王。比利·海靈頓，是一位世界知名GV片演員，而他走向知名的開端，正是因為幾段摔角視... 2023-03-10
圖文千與千尋的十個恐怖真相
千與千尋的十個恐怖真相?不存在的國道原片一開始出現的路标上“國道21号”，日本那時是沒有第21條國道的，也就是說，千尋一家人走入了根本不存在的一條國道，這個地方也是給千尋一家即将神隐做一個鋪墊，下面我們就來說一說關于千與千尋的十個恐怖真相?... 2022-07-10
圖文女寶寶身高一般遺傳爸爸還是媽媽
春天到了，除了樹木在冒嫩芽，我們的孩子，也在努力拔高。那麼，“春天是長個的黃金期”，這話可信嗎？可信的！美國兒科學會認為：在四個季節中，春季是孩子長個最快的季節。如果我們能把握好這個黃金時期，就真能讓孩子“悄悄長高，然後驚豔所有人”！就像張... 2023-03-17
圖文産品與人群精準匹配
編輯導語：當下的互聯網電商、直播、短視頻等等産品都涉及了人貨匹配模型。人貨匹配模型中最核心的就是人貨匹配的方法以及步驟。這篇文章從導購型匹配、門店型匹配、商場型匹配三個方面來跟大家介紹人貨匹配模型。一起來看看吧。多數據分析書本、文章都提過人... 2022-12-07
圖文宋朝書法成就誰的好
宋朝書法成就誰的好?《夏承焘墨迹選》出版後，我在一些微信朋友圈轉發了相關消息但我發現書法圈的同仁對這本書的熱情不是很高，為什麼會這樣？值得思考，現在小編就來說說關于宋朝書法成就誰的好?下面内容希望能幫助到你，我們來一起看看吧!宋朝書法成就誰... 2022-12-23
圖文高曉攀流行語
2015年的時候，張雲雷改編了一首北京小曲《探清水河》，2017年開始有人在小園子把六哥哥唱成“辮兒哥哥”，2018年開始嶄露頭角，一曲《探清水河》響徹大江南北，2020年張雲雷買下了這首歌改編後的版權。2022年，高曉攀發布了一首單曲《探... 2023-02-12
圖文犯太歲三年不利
國際人居環境易學研究院到底什麼是犯太歲？自古以來，中國民間都有一種說法為“太歲當頭坐，無災恐有禍”，因此很多人怕命犯太歲，更關注自己本命年犯太歲應該怎麼化解，每到年初便有了擺太歲，化太歲，安太歲的說法，當然也有很多人對犯太歲一事嗤之以鼻，認... 2023-02-02
圖文美心防盜門的材質如何
這段時間在給家裡做産品網上運營，家裡一直都在做美心防盜門，今年準備做個高端系列的，在盼盼防盜門/王力防盜門/步陽防盜門裡面選了選高端系列，後面了解到美心這個系列确實太奈斯，工藝獨特，很多年輕人都喜歡風格明确的大門，我也趁此機會在這裡給大家介... 2023-03-10

tft每日頭條

> 圖文

> 通俗的講什麼是unicode

通俗的講什麼是unicode

相关圖文资讯推荐

热门圖文资讯推荐

网友关注