導讀:這一篇聊操作系統。最近大家對“卡脖子”讨論很多,首當其沖是芯片,緊接着就是操作系統。操作系統,英文名Operating System,所以也常簡稱“OS”。操作系統很重要,計算機系的學生都知道,操作系統作為一門核心專業課,和數據庫、編譯原理合稱“三座大山”。
作者:木羊同學
來源:華章科技
01 操作系統都學些什麼
操作系統的重要性當然不止于此。如果深入研究你就會發現,操作系統在整個計算機學科體系中處于一個十分關鍵的位置。計算機科學的學科方向多如牛毛,但總的來說可以分成兩塊,硬件一塊,軟件一塊,這兩大塊都喜歡各玩各的,中間說是隔着次元壁也一點不誇張。
但都在一個體系内,總要想個辦法來打破次元壁呀,這個重要的工作由誰來做呢?就是操作系統。所以從體系架構的角度看,操心系統是處在所有硬件的最上層,和所有軟件的最下層,是一個“跨界”的角色。
操作系統很重要,那作為一門學科,難不難學呢?大家的态度走兩個極端,一邊的人覺得操作系統有什麼可學的,不就是點鼠标劃玻璃,太簡單連小學的計算機課都不一定認真教,大學還專門設了專業課太誇張了。另一邊的人又覺得操作系統太難,操作系統的玩家不是Linus這樣的業界大神,就是微軟、谷歌這樣的行業大佬,萌新小本隻好瑟瑟發抖。
這些觀點對不對呢?
都有一些理解上的偏差。我們平時常說的“安裝操作系統”,這裡的“操作系統”,準确來說,應該叫“操作系統産品”,而操作系統這門課,主要内容講的是操作系統的内核原理。
操作系統産品和操作系統内核二者的關系,有一點像計算機和CPU,沒有它不行,光有它也不行。一款操作系統産品,首先肯定得有操作系統内核,但是光有内核是沒法使用的,還得加上配套的周邊功能。
雖然叫“周邊配套”,但絕不是可有可無的意思,大部分我們所熟識操作系統功能,實際上都是屬于“周邊配套”,譬如說我們最最最熟悉的“桌面”,放着漂亮的壁紙,擺滿各色各樣的圖标,是操作系統主要的用戶交互界面,術語稱為圖形用戶界面(Graphical User Interface,簡稱GUI)。
前面感覺自己“精通操作系統”的那位同學,其實精通的隻是GUI的使用,而且很抱歉,GUI不在操作系統内核裡面。
不過,話說回來,雖然專門有“操作系統内核”這樣的術語,但并不意味着所謂的“内核”與“周邊”之間,天然就存在一條清晰的界限。在操作系統裡面,一直存在着宏内核和微内核兩條路線的争論,争論的焦點,正是什麼該劃入“内核”,什麼又該算作周邊。
微内核的主張,顧名思義,就是最小化内核所需要提供的服務,隻負責最基本的功能,把應用服務、驅動、GUI,甚至一些感覺上也挺基本的功能,譬如文件系統服務,都統統趕出内核。
這樣做的好處是靈活方便,像是要提供新服務,那直接新增就可以了,不需要對内核進行額外的改動,但缺點也很突出,什麼功能都趕出去了,真到用的時候還需要進行内核模式-用戶模式的切換,模式切換會增加額外的開銷,導緻性能受損,因此就有人主張應該把常用的功能都接納進來,這就是宏内核。
Windows早前采用的就是微内核架構,把GUI趕了出去,結果性能損失受不了,後來又重新請回來,一直到現在,GUI仍然是Windows内核的一部分。
02 操作系統的核心内容
操作系統這門課主要研究的是操作系統内核,這名字不太平易近人,容易給人“難學懂”的感覺。确實,現在操作系統的功能越來越豐富,連帶着操作系統内核也越來越複雜。有一本操作系統業内很有名的書,叫《Windows Internals》,講的是Windows操作系統的功能原理,從這本書就可以看出來操作系統的一個變化趨勢。
《Windows Internals》是跟着Windows推陳出新的,Windows不斷更新,這本書也不斷再版,一個肉眼可見的變化就是書越寫越厚,現在最新版幹脆把一本書分成了上下兩卷,内容太多,光一塊磚頭已經不夠裝了。
這還隻是Windows,現在是移動互聯網時代,還有操作系統還有一半多的江山被iOS和Android這哥倆占着,而且都以一年一個版本的速度叠代,要學的知識豈不是漫無邊際?
其實不用擔心,操作系統确實在迅速發展,但最最核心的還是那些老兄弟。操作系統有一本非常經典的教材,隻要你問就一定會有人推薦,叫《Operating System Concept》,中文譯為《操作系統概念》。因為這本書的封面畫着恐龍,所以學界也稱為“恐龍書”。
恐龍書不但介紹操作系統知識,還會引入“當前主流操作系統”作為研究案例。當然,恐龍書已經從第1版發展到了第9版,書裡的“當前主流操作系統”也一換再換,默默地記錄着操作系統的變化發展。
不過,我把幾個版本比較了一下,最新版知識點增加了不少,還補充了一些新的内容,涵蓋了iOS、Android等移動操作系統,但主要的知識結構并沒有大幅調整,核心的研究對象和問題,仍然是早就登場的那幾個。
具體是哪幾個呢?就仨:進程、内存和存儲。操作系統最重要的功能就是“管理”,具體來說是兩項工作,資源的分配和資源的調度,那管理的核心對象是哪些呢?就是這仨,分别對應的硬件是CPU、内存和硬盤,想想就能知道,這仨同樣是計算機裡的三個扛把子部件。
我們說恐龍書經典,其中一個地方就體現在對操作系統知識體系的劃分上面。恐龍書當然會重點照顧這三個核心對象,為它們一一設有單元,再加上必不可少的概論、大家現在都很關注的安全,以及前面提到的案例分析,就構成了恐龍書最新第9版的六大知識闆塊。
作為一名操作系統愛好者,我看過很多操作系統的書,有偏重原理的,有偏重實例的,也會有其它新的偏重,譬如會為網絡,硬件架構、設備管理等等内容設置獨立章節,但無論哪本書,進程、内存和存儲(也有稱為外存)始終是書裡的三條主線。總而言之,學操作系統,首先都得緊緊抓住進程、内存和存儲學懂學通。
03 怎樣學操作系統
既然進程、内存和存儲是操作系統的三個核心對象,那具體應該怎麼學呢?一句話回答:帶着問題學。這裡的“帶着問題學”,和我們平時常說的有所不同,在操作系統裡面,進程、内存和存儲都有各自需要重點關注的問題。
就拿進程來說,進程是操作系統中相對比較抽象的概念,所以大多數操作系統的教材都會不吝筆墨,給進程下一堆的定義,試圖隻靠文字就解釋清楚什麼是進程。不過效果總不太好,大家不容易看懂,還容易看暈,畢竟“抽象”的意思就是說,你懂了馬上心領神會,你不懂總感覺雞同鴨講。
我倒認為沒必要在進程的定義上作過多糾結,關鍵是功用,開始隻需要記住一點,進程對應的是CPU。計算機所謂的“計算”,指的就是CPU運算,那運算什麼内容呢?這就是進程。
本來這個過程不算複雜,好像也沒什麼問題,但是後來人們搞出了“多進程”,一個CPU能“同時”運行多個進程。但這個“同時”不是真正的同時,用術語來說,是并發執行而不是并行執行,結果一下就複雜起來,問題也就随之而來了。
進程增多了,但CPU卻隻有一個,出現了多對一的競态問題,這就是一切問題的起源。圍繞着競态問題,進程接着又衍生出了許多問題。
首先就是調度問題。對操作系統來說,調度是個大問題。書本肯定都會告訴你,進程有很多個狀态,有些還畫成了狀态遷移圖,各種線飛來飛去,看得眼花缭亂。感覺上很難,但我覺得,把握好了背後的邏輯,這些看似淩亂的知識點就是條理清晰地串在一起。
在這裡,我們隻需要死死盯住競态問題,正是因為進程和CPU不再是一一對應,所以需要調度,而所謂調度,就是雜技裡的用兩隻手玩五隻球,總會區分出接回手裡的、準備抛出的和停在空中的幾種情況,所以也需要根據情況給進程配套設計不同的狀态,調度的具體工作,就是想辦法讓進程在這幾個狀态中來回遷移倒騰,最終營造出CPU同時執行多個進程的假象。
進程之下是線程,現在又搞出了協程和纖程,以後不知道還會什麼程,不過,目的隻有一個,更充分地利用CPU時間,而且都難以避免一個問題,就是調度問題。
調度本身不難,難就難在設計調度原則,誰上誰下,執行多久,等待多久,都需要一一加以考慮,而且最難的地方在于,調度是沒有最優解的,隻有在指定原則條件下,設計出相當不錯的調度方案。
進程除了競争CPU,還要競争資源,譬如兩個甚至更多的進程可能都需要同時讀寫同一個文件,我們熟悉的多對一的關系,會導緻我們熟悉的競态問題,在CPU那導緻了調度問題,而到了資源這裡,則會導緻同步問題和死鎖問題。
同步問題很簡單,進程既然要調度,那肯定沒辦法把活一口氣幹完,譬如說讀寫某個文件,讀到一半被換下來了,下次再換上來的時候發現,别的進程也在讀寫這個文件,内容變了。
多線程有一個默契,就是前後環境要保持一緻,你把我從CPU那換上換下我沒意見,但你得保證我所處的環境是相同的,别像雍正那樣一覺醒來發現大清亡了,後面也就沒法跟着劇本走。那怎麼保證一緻性呢,這就是同步問題,方法包括互斥鎖、信号量等等。
死鎖問題聽起感覺複雜一點,書上花了不少筆墨但内容還是不好懂。其實也不複雜,我們在小區門口喜聞樂見的堵車就是死鎖。小區門口隻有一條車道,早高峰大家都得排着隊出去,這時如果外面有一輛車回來,開到門口又不肯避讓,那就堵車了,用操作系統的術語來說,就是死鎖了。
前面說,為了解決同步問題,我們會采取互斥鎖等方法,簡單來說,當多個進程都要使用同一項資源時,隻有當前正在使用的進程用完了,也就是術語所說的資源釋放了,後面的進程才可以接着用。這樣做的好處當然是保證了一緻性,但壞處則是導緻了另一個問題,就是死鎖問題。
拿前面的小區出口比劃一下就清楚了。單車道當然是互斥的,要麼隻進要麼隻出,不可能一邊進一邊出。如果兩頭的來車各占一半車道,結果當然是想進來的進不來,想出去的出不去,兩頭堵死,這就死鎖了。
那怎麼解決死鎖問題呢,大方向有兩種,一種是避免出現死鎖,從根本上解決這個問題,不過難度較大。另一種則是想辦法對已經發生的死鎖及時檢測發現,然後進行恢複。但是怎麼才能及時發現死鎖呢?這又是一個操作系統方向需要研究的問題。
關于作者:莫凡,網名木羊同學。娛樂向機器學習解說選手,《機器學習算法的數學解析與Python實現》作者,前沿技術發展觀潮者,擅長高冷技術的“白菜化”解說,微信公衆号“睡前機器學習”,個人知乎号“木羊”。
延伸閱讀《現代操作系統:原理與實現》
推薦語:操作系統和系統安全領域國際知名學者、上海交通大學陳海波、夏虞斌領銜撰寫。作者在複旦大學和上海交通大學十餘年操作系統教學經驗的科學總結。由淺入深介紹現代操作系統經典理論與方法,結合前沿研究與工業界實踐,面向真實場景與真實問題。全新打造ChCore微内核系列課程實驗,建立對操作系統的第一手實踐經驗。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!