分布式系統詳細介紹-tft每日頭條

分布式系統詳細介紹

科技更新时间:2026-07-23 12:32:50

分布式系統詳細介紹（一張無腦清單告訴你分布式系統代碼有多複雜）1

開篇

微服務架構在當今的軟件工程領域被廣泛采用。同時，采用分布式架構的組織也發現需要考慮分布式故障的附加複雜性，而這種複雜性往往超出實際業務邏輯。

雖然分布式計算的謬誤是有據可查的，但對于組織而言并不是一件容易的事情。因此，構建大規模、可靠的分布式系統架構就成為一個難題。作為推論，當我們将網絡交互的複雜性引入其中時，在原先非分布式系統中看起來很好的代碼就有可能成為一個大問題。

在生産代碼中摸爬滾打幾年後，遭遇了各種故障模式并且發現導緻故障的根源之後，我逐漸能夠識别一些更常見的故障模式。由于不同公司以及使用不同的語言堆棧之間存在差異（取決于内部基礎設施和工具的成熟度），但是可以從産生問題的原因中總結出一些具有共性的經驗。

下面就是我從這些經驗中總結出來的一些代碼審查指南，這個指南可以形成一份清單，并用來審查分布式環境中與系統間通信相關的代碼。雖然這份清單上提到的問題并不适用所有情況，但它們覆蓋了代碼審查的基本面，可以按照這個清單将問題走查一遍，在此過程中标記缺失的項目以供進一步讨論，利用這種方式發現系統中的問題是非常行之有效的。從這個意義上來說，可以通過這個“無腦清單”來發現大多數問題。

如何調用遠程系統1、當遠程系統發生故障時會發生什麼？

無論系統設計的多麼謹慎，它都會出現故障 - 這是在生産中被印證的事實。故障的發生可能源于代碼錯誤，基礎設施問題，流量激增，系統疏于管理等，總之結果是引發故障。調用者如何處理故障将決定整個架構的彈性和健壯性。

定義錯誤處理路徑：必須在代碼中明确錯誤處理路徑，而不是讓系統在最終用戶面前崩潰。這裡需要向用戶明确指出錯誤，例如：設計良好的錯誤頁面、帶有錯誤信息的異常日志，以及帶有回退機制的斷路器等。

制定恢複計劃：考慮代碼中的每一次遠程交互，并弄清楚如何恢複被中斷的工作。思考如下價格問題：工作流程是否需要有狀态才能從故障點觸發？是否将所有失敗的有效請求發布到重試隊列/數據庫表，并在遠程系統恢複時重試請求？是否有腳本來比較兩個系統的數據庫并以某種方式使它們同步？在部署系統之前，是否有一個明确的系統的恢複計劃？

2、當遠程系統變慢時會發生什麼？

這種情況比徹底失敗更難辦，因為我們不知道遠程系統是否在工作。因此需要檢查以下事項從而處理這種情況。如果我們使用類似 Istio的服務網格技術，其中一些問題可以輕松搞定而不需要修改應用程序代碼。即便如此，我們也應該關注這些問題。

為遠程系統調用設置超時：這包括遠程 API 調用、事件發布和數據庫調用的超時時間。我在很多代碼中發現過這個問題，因此需要檢查遠程系統是否設置了合理的超時時間，從而避免該系統在無響應時調用者因為等待而浪費資源的情況發生。

超時重試：網絡和系統并不是100%可靠的，重試對于系統恢複是非常必要的。重試機制會消除系統交互中的許多“問題”。如果可能，在重試中使用某種補償機制（固定的、指數的）。在重試機制中添加一點抖動（這裡的抖動可以理解為随機重試，例如設置随機的重試時間3-5s重試一次，避免所有調用者一起地不斷地對被調用者進行重試，導緻被調用者的負載增大），這樣做可以給被調用系統一些喘息的空間，通過能夠保證調用者在負載下獲得更好的調用成功率。重試的另一面是幂等性，我們将在本文後面介紹。

使用斷路器：一些應用程序并沒有預先打包這個功能，但我看到公司内部會編寫自己的包裝器。如果你有這個需求，一定要實現它，對斷路器的投入會讓你獲益。它會提供明确的框架來定義錯誤情況下的回退策略。

不要把超時當作請求失敗來處理——超時不是失敗，而是一種不确定的場景，應該通過一種處理方式來應對這種不确定性。因此需要建立明确的處理機制，允許系統在發生超時的情況下進行同步。處理機制可以是簡單的協調腳本，也可以是有狀态的工作流，或者是通過死信隊列（消息被拒絕、消息TTL過期、隊列達到最大長度）實現。

不要在事務中調用遠程系統——當遠程系統訪問速度變慢時，依舊會長時間保持數據庫連接，如果訪問持續而因為速度的問題一直無法完成系統的訪問，會導緻數據庫的連接也無法釋放，也就将數據庫連接用完，最終造成系統中斷的後果。

使用智能批處理：如果處理大量數據請求，可以逐個進行批量遠程調用（API 調用、數據庫讀取）從而消除網絡開銷。每個批量處理的量越大，整體延遲就會越大，可能失敗的工作單元也會越多。因此需要針對性能和容錯性優化批量大小。

如何面對調用方請求

所有 API 必須保證幂等性：幂等性是為了實現調用方API的超時重試功能。隻有API 能夠支持安全重試且不會有副作用時，調用者才能安心使用重試功能。這裡的API 是指同步 API 和任何消息傳遞接口——調用者可能會發布兩次相同的消息（或者代理可能會發送兩次）給到該API。

明确定義響應時間和吞吐量 SLA 以及遵守定義的規則：在分布式系統中，快速失敗比讓調用者等待要好得多。誠然，吞吐量 SLA 很難實現（分布式速率限制一個難題），但我們需要确保SLA在主動呼叫失敗時做好準備。另一個重要方面是了解下遊系統的響應時間，以确定系統最快的速度。

定義和限制批處理 API：如果公開批處理 API，則應明确定義最大批處理的數量，這個數量需要受到SLA的限制，也就是需要遵守 SLA的規則定義。

預先考慮可觀察性：可觀察性意味着能夠分析系統的行為，而無需通過查看API或組件的内部來實現。預先考慮你關心的系統指标以及需要收集的數據，幫助你回答以前未提出的問題。再對系統進行檢測并獲得這些數據。執行此操作的一個強大機制是識别系統的域模型，當域中發生某個事件時進行發布事件的操作。（例如收到請求 id 123，返回請求 123 的響應——注意如何使用這兩個“域”事件會導出一個稱為“響應時間”的新指标。将原始數據轉換到預先确定的聚合中）。

一般性原則

盡量使用緩存：網絡變化無常，因此盡可能多地使用緩存，并不斷講最新的數據保存其中。當然，有可能會使用遠程緩存機制（例如，Redis 服務器運行在單獨的服務器上），但至少通過緩存的方式可以将數據帶入控制域并減少系統的負載。

考慮單元故障：如果一個 API 或一條消息代表多個工作單元（批處理），那麼需要思考單元故障意味着什麼？如果有效載荷都失敗一次意味着什麼？又或者單個單元獨立成功或失敗意味着什麼？部分成功呢，API 是否響應成功或失敗代碼？

這裡的意思是一個API調用多個工作單元，這裡的工作單元可以是一個組件或者是一個API。有可能在調用多個工作單元的時候，其中一個工作單元失敗了，或者有的工作單元成功了，這個時候作為最外層調用這些工作單元的API來說要考慮好是成功還是失敗，如果失敗如何返回失敗信息。

在系統邊緣隔離外部域對象：不允許以重用的名義在系統中使用其他系統的域對象。這将會加劇我們的系統與其他系統的實體建模的耦合，在其他系統發生更改時，我們的系統都會進行大量重構。我們應該始終構建自己的實體表示并将外部有效負載轉換為此我們系統内的模式，然後我們的系統中使用它。

安全性

在每個邊緣清理輸入：在分布式環境中，系統的任何部分都可能受到損害（從安全角度來看）。因此，在系統邊界處會對進入系統的數據進行“消毒”處理，這裡有一個假設就是這些進入系統的數據有可能不是幹淨或安全的。

永遠不要提交憑證（Credentials）：永遠不要将憑證（數據庫用戶名/密碼或 API 密鑰）提交到代碼庫。雖然提交憑證到代碼庫對于某些人來說是常規操作，但我們需要摒棄這種陋習。始終遵守“憑證必須始終從外部（有安全存儲保證）加載到系統”的規則。

譯者介紹

崔皓，51CTO社區編輯，資深架構師，擁有18年的軟件開發和架構經驗，10年分布式架構經驗。曾任惠普技術專家。樂于分享，撰寫了很多熱門技術文章，閱讀量超過60萬。《分布式架構原理與實踐》作者。

來源：51CTO技術棧

作者：Kislay Verma

編譯：崔皓

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技經常用充電寶給手機充電傷手機嗎
出門如果沒帶充電寶，是不是就會感到焦慮？但手持幾千塊錢的iPhone、三星、華為高端機型，難免擔心用充電寶給手機充電，會不會對手機有什麼危害？用充電寶充電對手機有影響嗎？目前主流的充電寶使用的都是锂離子電芯和锂聚合物電芯。看起來和我們平常使... 2023-02-14
科技顔真卿楷書字帖欣賞大圖
墨迹手機字帖-唐顔真卿楷書《自書告身帖》-适合手機欣賞臨摹字帖《自書告身帖》，楷書墨迹，傳為顔真卿自書，然疑為僞托。共386字。書法蒼勁謹嚴，結銜小字亦一絲不苟，清淡絕倫。詹景風稱此書：“書法高古蒼勁，一筆有千鈞之力，而體合天成。其使轉真如... 2022-12-15
科技怎麼查找别人手機位置
怎麼查找别人手機位置?微信具有定位功能，可以将自己的位置發送給好友，也可以和好有實時共享雙方的位置，我來為大家講解一下關于怎麼查找别人手機位置?跟着小編一起來看一看吧!怎麼查找别人手機位置微信具有定位功能，可以将自己的位置發送給好友，也可以... 2022-06-08
科技二季度與第二季度
IT之家9月16日消息，今日，中國信息通訊研究院發布了2022年第二期《國内手機産品通信特性與技術能力監測報告》，該報告分析了今年第二季度我國新款手機的發展狀況。報告指出，2022年第二季度申請進網檢測的手機産品共89款，其中5G手機49款... 2022-12-26
科技華碩怎麼設置核心顯卡
一、前言在收到一張二手顯卡之後，有些操作幾乎是必須的，就比如說清灰、更換散熱矽脂等等，特别是我手裡的這張華碩的GTX980顯卡，顯卡的質量沒什麼問題，但就是散熱模塊很長時間沒有維護了，表現較差今天就通過這張華碩的GTX980顯卡，來講講如何... 2023-01-04
科技 cad打不開圖紙格式識别不了怎麼辦
目前市場上的CAD軟件版本已經更新到2020版本了，由于很多人還是習慣用老版本CAD軟件，比如2010版本，這個時候就會出現一個問題，老版本CAD軟件無法打開新版本軟件中保存的CAD圖紙，該怎麼辦呢？此時就需要進行CAD圖紙版本轉換了！在浩... 2022-12-16
科技保濕性價比高的護手霜測評
歐舒丹乳木果護手霜歐舒丹我覺得它更适用于非常幹燥的手掌，保濕感就像打開了新世界的大門一般。比起夏季它更适用于幹燥的秋季和冬季。jurlique玫瑰護手霜它的包裝簡單，幹淨，質地柔滑，不厚重，塗抹後能迅速的被皮膚吸收。最奇特的是它不是濃郁的香... 2022-11-08
科技富士達電梯智能模式
富士達電梯智能模式?王爾德曾說:“這個世界上好看的臉蛋太多,有趣的靈魂太少”對電梯行業而言，與建築風格匹配、精緻大方的硬裝潢，也如好看的臉蛋，逐漸成為電梯标配而隐于深層的軟裝潢，如電梯的高科技、安全、人性化配置，則成為大家更為看好的“靈魂”... 2023-02-21
科技軟件性能測試需求分析怎麼做
軟件性能測試需求分析怎麼做?要點一：獲取用戶數信息1）調查系統當前和未來使用的用戶數，我來為大家科普一下關于軟件性能測試需求分析怎麼做?下面希望有你要的答案，我們一起來看看吧!軟件性能測試需求分析怎麼做要點一：獲取用戶數信息1）調查系統當前... 2023-01-16
科技榮耀7x截屏錄屏文件夾在哪
榮耀7x截屏錄屏文件夾在哪?截屏文件的保存位置，和系統設置的【默認存儲位置】一緻，您可以點擊【文件管理】>【圖片】Screenshots>下查看或修改默認存儲位置，下面我們就來說一說關于榮耀7x截屏錄屏文件夾在哪?我們一起去了解并探讨一下這... 2022-06-18
科技 win7電腦啟動慢怎麼辦
首次使用時，Win旗艦版計算機的啟動速度就像閃電一樣快，但是長時間使用後感覺越來越慢，而且啟動時間也很長。然後Win7旗艦版計算機啟動緩慢，如何處理呢？尚不了解的朋友和SystemHome的編輯将學習如何處理Win7旗艦計算機啟動緩慢的問題... 2022-12-17
科技沒有網絡手機怎麼投屏到電視
今天是7月的最後一天，現在是18:12手機欠費了，獨自一人在家，手記和家裡的寬帶綁定，手機欠費的同時家裡的網絡也不能用，附近沒有什麼商業區，沒有無線網絡可以蹭。在家裡連續将近一個月在玩手機和平闆，突然間失去網絡心慌是免不了的。沒有網絡的我有... 2023-01-12
科技 androidtv應用鎖
談及現在不少家庭都在用的智能電視，智能盒子，大多都是以谷歌安卓系統進化改進而來的，簡單說他們的核心都是谷歌安卓，和安卓手機一樣可以支持所有安卓應用程序的安裝和使用，但用于操控方式（手機電容觸屏改遙控器紅外或藍牙按鍵）和畫面顯示比例的不同（手... 2023-01-01
科技不吃粉的美妝蛋推薦測評
測評！！！！真正的好用的美妝蛋，必須是好用高性價比的！！美妝蛋沒有不吃粉的，吃粉成都相差也并不明顯！這個不能因為哪個美妝博主說哪款不吃粉，你就相信了！小編自己用過一遍之後，做了一些心得分享，希望對每天都需要用到美妝蛋的姐妹有一點幫助哦~1.... 2023-01-10
科技告訴你什麼是大數據時代
“最近15天有沒有去過新發地？”這是北京市民最近要回答的高頻問題。如果你不巧在這15天内去過或者是經過新發地，那麼你會收到這一條短信。相信你跟我一樣會很驚訝，别人是怎麼知道我去過新發地？哪一種手段知道的？為什麼還能發短信給我？我的隐私問題怎... 2023-02-20
科技馬桶水箱開關裝上為什麼按不下去
馬桶水箱開關裝上為什麼按不下去?馬桶水箱側開關松動脫落了、在使用中搖晃但是還可以使用，朔料螺絲就是上不上，感覺滑絲，花費了很多時間，廢了九牛二虎之力才算修好，為了讓大家以後遇到這類問題不會頭疼，我把方法告訴大家，維修的方法很簡單：當螺絲上不... 2023-02-20
科技買手機主要看什麼
買手機主要看什麼?處理器，處理器關系到手機的整體性能，就好比人的大腦一樣，隻有處理器性能優越，手機才能流暢的使用；現在主流的是八核處理器，有四核、雙四核，下面我們就來聊聊關于買手機主要看什麼?接下來我們就一起去了解一下吧!買手機主要看什麼處... 2022-06-17
科技怎麼讓網站更有設計感
層次頁面設計需要層次感，當頁面缺乏層次感的時候就會顯得頁面比較單調或者花哨。頁面層次感可能有很多類型，例如色彩的層次感、元素的層次感等等。版面不要太長，欄目不要太多做網站建設的時候盡量不要讓版面做長，由于欄目也不多，因此闆塊的數量也要少一些... 2022-11-26
科技深圳電阻觸摸屏技術指導
如今，我們的身邊有着許多電子産品。對于電子産品，我們使用之前要了解清楚它的使用性能，掌握多點信息，這樣子在使用的過程中才不會出現問題。據勳瑞光電科技小編了解，相比傳統的電阻式觸摸屏，電容式觸摸屏的優勢主要有以下幾個方面：1、操作新奇。電容式... 2022-12-04
科技酷睿i74710可以玩端遊嗎
很多人認為電腦中CPU硬件最重要，隻要把CPU選好了就行了，其實這個說法是不正确的，電腦主要大硬件有：CPU、CPU散熱、内存條、硬盤、主闆和顯卡及電源，這些硬件都重要，如果把目光隻停留在CPU硬件上面，那電腦的性能是不會出色的，最多也就隻... 2023-01-18
科技 lumion快速操作指南
Lumion是一個簡單快速的渲染軟件，其旨在實時觀察場景效果和快速出效果圖，優點是速度快，界面友好，自帶中文，水景逼真，樹木真實飽滿，後期效果相當容易。可以在短時間内制作出一個相對較高水平的作品。Lumion可以用來制作電影，也可以用來靜幀... 2023-03-26
科技 flutter web應用
本文為Flutter應用開發的第一篇文章，我們将通過幾個Flutter實例來演示下Flutter平台下界面開發的一個重要概念：一切皆為組件。本文将在Windows11操作系統下使用AndroidStudio進行Flutter應用的開發，我們... 2023-02-19
科技零首付買手機要注意什麼
本文由“微兔君”原創，轉載請注明。現在很多賣手機的店鋪都支持0首付分期付款，對很多想換手機而沒有那麼多錢的朋友來說有着非常大的吸引力。而很多人對于貸款知識完全白紙，神經較粗的朋友更是在店員拿出分期貸款合同後，看都不看，直接簽下了大名。大家一... 2023-02-14
科技 wd固态硬盤與ssd固态硬盤
記不清我姐是第幾次摔壞移動硬盤，每次都是因為移動硬盤和圖紙，布料夾在一起後意外落地。雖然硬盤早就有防掉落技術，但是也就是從電腦桌到地面左右的高度的掉落，實測超過1.7就會摔壞了。雖然，硬盤可以進行數據恢複，但能拯救多少數據就隻能看臉。緣分到... 2022-12-03
科技茶業的創新體系
原标題：科技賦能探索茶業優化新路徑——中茶院領銜項目攻關再結創新碩果11月1日，由中華全國供銷合作總社杭州茶葉研究院、浙江大學、紹興禦茶村茶業有限公司、江南大學聯合申報的“食材化茶制品技術開發與應用”項目摘得全國商業科技進步獎特等獎。此消息... 2023-01-12
科技随便買充電器充電手機會壞嗎
理論上，智能手機取消标配的充電器的确有利于環保，因為誰家裡沒有幾個閑置的充電器？而且這些充電器之間都可以相互兼容。問題來了。蘋果之所以可以領頭不送充電器，一方面是因為它是Apple（iOS生态的唯一），二是iPhone用戶都習慣了“五福一安... 2022-10-27
科技 win10的windows文件夾大
Win10安裝的時候，但凡登錄了自己的微軟賬戶，都會發現用戶文件夾都是生成的英文名，超過5個字符的還自動被截取了前五位，要中文沒有，英文也不對，強迫症患者對此紛紛表示不滿，小編今天就來分享一下如何改成自己想要的文件夾用戶名。首先，在安裝好的... 2023-01-10
科技小米k50系統更新關閉
小米k50系統更新關閉?小米成背鍋俠？用戶反映K50系列殺後台嚴重，官方：應用本身原因，下面我們就來聊聊關于小米k50系統更新關閉?接下來我們就一起去了解一下吧!小米k50系統更新關閉小米成背鍋俠？用戶反映K50系列殺後台嚴重，官方：應用本... 2022-10-03
科技 12+256曲面屏手機性價比最高機型
随着智能手機配置越來越全面，功能越來越多，用戶對手機内存的要求也越來越大。微信聊天記錄、拍攝的照片視頻以及App緩存等，都會占據大量的手機内存，有一說一，256G真的不夠用了。所以現在購買手機，512G内存版本已經是“入門”選擇了。如果你也... 2023-01-20
科技 win7電腦開機顯示bootmgr怎...
今天在啟動電腦的時候，電腦無法啟動，報錯如下圖所示根據這個報錯初步判斷是分區引導信息丢失導緻的。按照IT狗的一貫思維開始百度搜索解決問題。搜索發現“BOOTMGR丢失”錯誤有很多可能的原因，包括缺少操作系統，損壞的系統文件和損壞的硬盤扇區。... 2023-01-08

tft每日頭條

> 科技

> 分布式系統詳細介紹

分布式系統詳細介紹

相关科技资讯推荐

热门科技资讯推荐

网友关注