tft每日頭條

 > 生活

 > 計算機語言的發展曆程

計算機語言的發展曆程

生活 更新时间:2025-01-06 06:29:41

歡迎關注我,學習更多計算機知識!

人類想要讀懂計算機,就需要把計算機輸出的内容轉化為我們人類所能理解的語言,然後顯示在屏幕上。

計算機隻能處理二進制數據,那麼如果計算機處理完二進制直接輸出到屏幕上人是看不懂的。那麼也是需要一套翻譯系統根據一套規則幫我們把二進制翻譯成自然語言

計算機語言的發展曆程(人類如何讀懂計算機語言)1

學過英語的都知道把英語翻譯成漢語,其實就是根據語法規則和單詞。那麼其實計算機也是這樣。

很久以前有一群聰明人他們決定用8個可以開合晶體管來組合成不同的狀态,來表示人類所能理解的數字和符号,他們把這8個晶體管稱為字節。

計算機語言的發展曆程(人類如何讀懂計算機語言)2

再後來,他們又做了一些可以處理這些字節的機器,可以用晶體管組合出很多種狀态,然後計算機的雛形就誕生了。

世界上第一台通用計算機“ENIAC”于1946年2月14日在美國賓夕法尼亞大學誕生。

第一台計算機是美國國防部用來計算彈道的,也就是說第一台計算機是美國用在軍事上的。它非常大,用了18000個電子管,占地170平方米,重達30噸,耗電功率約150千瓦,每秒鐘可進行5000次運算。

計算機語言的發展曆程(人類如何讀懂計算機語言)3

為什麼要用這麼多電子管,因為電子管越多能處理的狀态就越多,這樣能處理的速度就越快。

用八位的二進制表示一個字節,一共可以組合出256(2的8次方)種不同的狀态

字節,它是計算機信息技術用于計量存儲容量的一種計量單位,8位二進制數組合起來就有2的8次方種不同的狀态,因為每一位二進制有2種狀态0和1

剛開始計算機把其中的編号從0開始的32種狀态分别規定了特殊的用途,一旦終端、打印機收到約定好的這些字節被傳過來時,就要做一些約定的動作。

計算機語言的發展曆程(人類如何讀懂計算機語言)4

如收到 0001 0000, 終端就換行,收到0000 0111, 計算機就向人們嘟嘟叫,收到0000 1001, 打印機就打印反白的字,或者計算機就用彩色顯示字母。于是就規定把這些0010 0000以下的字節狀态稱為”控制碼”。

然後把所有的空格、标點符号、數字、大小寫字母分别用連續的字節狀态表示,一直編到了第127号,這樣計算機就可以用不同字節來存儲英語的文字了。

計算機語言的發展曆程(人類如何讀懂計算機語言)5

大家看到這樣,都感覺很好,于是大家都把這個方案叫做ANSI的”ASCII”編碼(美國信息互換标準代碼)。當時世界上所有的計算機都用同樣的ASCII方案來保存英文文字。

後來計算機發展越來越廣泛,世界各國為了可以在計算機上保存他們的文字,他們決定采用127号之後的空位來表示這些新的字母、符号,還加入了很多畫表格時需要用下到的橫線、豎線、交叉等形狀,一直把序号編到了最後一個狀态255。從128到255這一頁的字符集被稱”擴展字符集”。

計算機語言的發展曆程(人類如何讀懂計算機語言)6

這樣的話所有的狀态都被用完了。

等到中國人民開始使用計算機了,發現狀态都被你們用完了,那我們如何來表示中文字符呢?況且有6000多個常用漢字需要保存呢。

聰明的中國人就想,靠你們來開發是不可能的了。

于是就自主研發,把那些127号之後的奇異符号們直接取消掉。規定:一個小于127的字符的意義與原來相同,但兩個大于127的字符連在一起時,就表示一個漢字。

這樣我們就可以組合出大約7000多個簡體漢字了。在這些編碼裡,我們還把數學符号、羅馬希臘的字母、日文都編進去了。

連在 ASCII 裡本來就有的數字、标點、字母都統統重新編了兩個字節長的編碼,這就是常說的”全角”字符,而原來在127号以下的那些就叫”半角”字符(也就是占一個字節)了。

中國人民看到這樣很不錯,于是就把這種漢字方案叫做 “GB2312″。GB2312是對ASCII的中文擴展。

計算機語言的發展曆程(人類如何讀懂計算機語言)7

但是中國的漢字太多了,後來還是不夠用,于是幹脆不再要求低字節一定是127号之後的内碼,隻要第一個字節是大于127就固定表示這是一個漢字的開始,不管後面跟的是不是擴展字符集裡的内容。

結果擴展之後的編碼方案被稱為GBK标準,GBK 包括了 GB2312 的所有内容,同時又增加了近20000個新的漢字(包括繁體字)和符号。後來少數民族也要用電腦了,于是我們再擴展,又加了幾千個新的少數民族的字,GBK擴成了GB18030。

因為當時各個國家都像中國這樣搞出一套自己的編碼标準,結果互相之間誰也不懂誰的編碼,誰也不支持别人的編碼。

第一個發明漢字輸入法的是王永民(王碼鍵盤輸入發明者)從此字登上了信息化的舞台。

計算機語言的發展曆程(人類如何讀懂計算機語言)8

當時的中國人想讓電腦顯示漢字,就必須裝上一個”漢字系統”,專門用來處理漢字的顯示、輸入的問題,裝錯了字符系統,顯示就會亂碼。

就在這時,一個叫ISO(國際标準化組織)的國際組織看不過去了,決定着手解決這個問題。

他們采用的方法很簡單:廢了所有的地區性編碼方案,重新搞一個包括了地球上所有文化、所有字母和符号的編碼!

于是所有問題的解決了,也統一的各個國家的所有語言。

他們打算叫它”Universal Multiple-Octet Coded Character Set”,簡稱 UCS, 俗稱“UNICODE”

UNICODE 來到時,計算機網絡剛好興起,UNICODE如何在網絡上傳輸也是一個必須考慮的問題。

于是面向傳輸的衆多 UTF(UCS Transfer Format)标準出現了,顧名思義,UTF8就是每次8個位傳輸數據,而UTF16就是每次16個位,隻不過為了傳輸時的可靠性,從UNICODE到 UTF時并不是直接的對應,而是要過一些算法和規則來轉換。

現在我們所使用的計算機基本上所有的操作系統都自帶了UNICODE和UTF8等基本的字符集,可以随時切換。Windows XP、Windows7操作系統自帶的都是GBK字符集(含2萬餘漢字)

這樣的話操作系統就可以幫我們把計算機輸出的二進制翻譯成人類能讀懂的文字了。

那麼圖片和視頻又是如何翻譯的呢?請觀看後續文章

歡迎關注我,學習更多計算機知識!

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved