你知道當我們在網頁浏覽器(Web browser)的地址欄中輸入URL時,Web頁面是如何呈現的嗎?
Web頁面當然不能憑空顯示出來。根據Web浏覽器地址欄中指定的URL,Web浏覽器從Web服務器端獲取文件資源(resource)等信息,從而顯示出Web頁面。像這種通過發送請求獲取服務器資源的Web浏覽器等,都可稱為客戶端(client)。
Web使用一種名為HTTP(HyperText Transfer Protocol,超文本傳輸協議[插圖])的協議作為規範,完成從客戶端到服務器端等一系列運作流程。而協議是對規則的約定。可以說,Web是建立在HTTP協議上通信的。
在深入學習HTTP之前,我們先來介紹一下HTTP誕生的背景。了解背景的同時也能了解當初制定HTTP的初衷,這樣有助于我們更好地理解。
為知識共享而規劃Web1989年3月,互聯網還隻屬于少數人。在這一互聯網的黎明期,HTTP誕生了。CERN(歐洲核子研究組織)的蒂姆·伯納斯-李(Tim Berners-Lee)博士提出了一種能讓遠隔兩地的研究者們共享知識的設想。最初設想的基本理念是:借助多文檔之間相互關聯形成的超文本(HyperText),連成可相互參閱的WWW(World Wide Web,萬維網)。現在已提出了3項WWW構建技術,分别是:把SGML(Standard GeneralizedMarkup Language,标準通用标記語言)作為頁面的文本标記語言的HTML(HyperText Markup Language,超文本标記語言);作為文檔傳遞協議的HTTP;指定文檔所在地址的URL(Uniform Resource Locator,統一資源定位符)。WWW這一名稱,是Web浏覽器當年用來浏覽超文本的客戶端應用程序時的名稱。現在則用來表示這一系列的集合,也可簡稱為Web。
網絡基礎TCP/IP接下來,我們僅介紹理解HTTP所需掌握的TCP/IP協議族的概要。
TCP/IP協議族計算機與網絡設備要想相互通信,雙方就必須基于相同的方法。比如,如何探測到通信目标、由哪一邊先發起通信、使用哪種語言進行通信、怎樣結束通信等規則都需要事先确定。不同的硬件、操作系統之間的通信,所有的這一切都需要一種規則。而我們就把這種規則稱為協議(protocol)。
協議中存在各式各樣的内容。從電纜的規格到IP地址的選定方法、尋找異地用戶的方法、雙方建立通信的順序,以及Web頁面顯示需要處理的步驟,等等。像這樣把與互聯網相關聯的協議集合起來總稱為TCP/IP。也有說法認為,TCP/IP是指TCP和IP這兩種協議。還有一種說法認為,TCP/IP是在IP協議的通信過程中,使用到的協議族的統稱。
TCP/IP的分層管理TCP/IP協議族裡重要的一點就是分層。TCP/IP協議族按層次分别分為以下4層:應用層、傳輸層、網絡層和數據鍊路層。把TCP/IP層次化是有好處的。比如,如果互聯網隻由一個協議統籌,某個地方需要改變設計時,就必須把所有部分整體替換掉。而分層之後隻需把變動的層替換掉即可。把各層之間的接口部分規劃好之後,每個層次内部的設計就能夠自由改動了。值得一提的是,層次化之後,設計也變得相對簡單了。處于應用層上的應用可以隻考慮分派給自己的任務,而不需要弄清對方在地球上哪個地方、對方的傳輸路線是怎樣的、是否能确保傳輸送達等問題。TCP/IP協議族各層的作用如下。
應用層傳輸層
網絡層(又名網絡互連層)
鍊路層(又名數據鍊路層,網絡接口層)
TCP/IP通信傳輸流
利用TCP/IP協議族進行網絡通信時,會通過分層順序與對方進行通信。發送端從應用層往下走,接收端則往應用層往上走。我們用HTTP舉例來說明,首先作為發送端的客戶端在應用層(HTTP協議)發出一個想看某個Web頁面的HTTP請求。接着,為了傳輸方便,在傳輸層(TCP協議)把從應用層處收到的數據(HTTP請求報文)進行分割,并在各個報文上打上标記序号及端口号後轉發給網絡層。在網絡層(IP協議),增加作為通信目的地的MAC地址後轉發給鍊路層。這樣一來,發往網絡的通信請求就準備齊全了。接收端的服務器在鍊路層接收到數據,按序往上層發送,一直到應用層。當傳輸到應用層,才能算真正接收到由客戶端發送過來的HTTP請求。
發送端在層與層之間傳輸數據時,每經過一層時必定會被打上一個該層所屬的首部信息。反之,接收端在層與層傳輸數據時,每經過一層時會把對應的首部消去。這種把數據信息包裝起來的做法稱為封裝(encapsulate)。
與HTTP關系密切的協議:IP、TCP和DNS按層次分,IP(Internet Protocol)網際協議位于網絡層。Internet Protocol這個名稱可能聽起來有點誇張,但事實正是如此,因為幾乎所有使用網絡的系統都會用到IP協議。TCP/IP協議族中的IP指的就是網際協議,協議名稱中占據了一半位置,其重要性可見一斑。可能有人會把“IP”和“IP地址”搞混,“IP”其實是一種協議的名稱。IP協議的作用是把各種數據包傳送給對方。而要保證确實傳送到對方那裡,則需要滿足各類條件。其中兩個重要的條件是IP地址和MAC地址(Media AccessControl Address)。IP地址指明了節點被分配到的地址,MAC地址是指網卡所屬的固定地址。IP地址可以和MAC地址進行配對。IP地址可變換,但MAC地址基本上不會更改。
使用ARP協議憑借MAC地址進行通信IP間的通信依賴MAC地址。在網絡上,通信的雙方在同一局域網(LAN)内的情況是很少的,通常是經過多台計算機和網絡設備中轉才能連接到對方。而在進行中轉時,會利用下一站中轉設備的MAC地址來搜索下一個中轉目标。這時,會采用ARP協議(Address Resolution Protocol)。ARP是一種用以解析地址的協議,根據通信方的IP地址就可以反查出對應的MAC地址。
沒有人能夠全面掌握互聯網中的傳輸狀況在到達通信目标前的中轉過程中,那些計算機和路由器等網絡設備隻能獲悉很粗略的傳輸路線。這種機制稱為路由選擇(routing),有點像快遞公司的送貨過程。想要寄快遞的人,隻要将自己的貨物送到集散中心,就可以知道快遞公司是否肯收件發貨,該快遞公司的集散中心檢查貨物的送達地址,明确下站該送往哪個區域的集散中心。接着,那個區域的集散中心自會判斷是否能送到對方的家中。我們是想通過這個比喻說明,無論哪台計算機、哪台網絡設備,它們都無法全面掌握互聯網中的細節。
确保可靠性的TCP協議
确保數據能到達目标
為了準确無誤地将數據送達目标處,TCP協議采用了三次握手(three-wayhandshaking)策略。用TCP協議把數據包送出去後,TCP不會對傳送後的情況置之不理,它一定會向對方确認是否成功送達。握手過程中使用了TCP的标志(flag)——SYN(SYNchronize)和ACK(acknowledgement)。發送端首先發送一個帶SYN标志的數據包給對方。接收端收到後,回傳一個帶有SYN/ACK标志的數據包以示傳達确認信息。最後,發送端再回傳一個帶ACK标志的數據包,代表“握手”結束。若在握手過程中某個階段莫名中斷,TCP協議會再次以相同的順序發送相同的數據包。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!