netflix的技術-tft每日頭條

netflix的技術

科技更新时间:2026-07-26 01:38:01

淩晨，時針指向兩點，我們技術保障團隊一半的人手還在追查Netflix出錯的原因。系統看起來運行還算正常，肯定是有哪不對但我們死活也找不着。查了一個小時，終于發現原來是數據中心裡一台服務器出了問題。我們一直在查找有沒有什麼特别明顯的問題，而且數據中心有好幾萬台服務器，所以把這個小淘氣給忽略掉了。

連續劇《夜魔俠》裡面的主角是個瞎子，但其他的感官異常靈敏。這使他可以察覺到某個人行為上的些許異常從而判斷出這個人是否在撒謊。我們也開發了一個系統來發現服務器之間細微的差别，差别雖然小，但可能就是這些小的地方出問題。

本文中我們将介紹這一自動異常偵測技術和問題服務器的修複。多虧了它，不然我們恐怕得整天半夜爬起來救火。

現在運行Netflix服務的有好幾萬台服務器，一般出問題的比例不會超過1%。比如說有一台服務器的網絡出了點問題導緻用戶的連接出現了延遲。雖然運行狀态不理想，但在服務器健康檢查中是看不出來的。

其實這種有問題的服務器還不如直接挂掉。起碼挂掉的話現有的監測系統和工程師能夠發現它挂了。現在它雖然沒有挂，但影響到了用戶的體驗，我們的客服還是一樣要接電話聽用戶的抱怨。也不知怎的，幾萬台服務器裡總有幾個要出問題。

netflix的技術（Netflix使用的異常服務器偵測技術）1

圖中不同顔色的線代表某個服務器的錯誤率。每條線都有峰值然後掉回到零，但紫色代表的這台服務器錯誤率一直高于其他服務器。從圖中你能看出紫色代表的服務器有異常嗎？有沒有辦法使用這些時序數據來實現異常偵測的自動化呢？

有一種簡單的方法是設置一個阈值，錯誤率高于阈值就報警，但隻适用于錯誤率特别高的服務器而且這種方法有一個問題就是所有數據都會有尖峰所以可能誤差會比較大，下面的圖中我們就很難找到一個合适的阈值，此外使用的阈值也需要定期進行調整因為服務器集中使用的時間和負載都可能出現變化。我們提高系統可靠性的突破點就是自動偵測那些有問題但用阈值法發現不了的服務器。

netflix的技術（Netflix使用的異常服務器偵測技術）2

為了解決這一問題我們使用了聚類分析算法。聚類分析算法的基本原理是将相似程度高的樣本歸到一類。這一算法是非監督式的所以我們不需要進行數據标記和提供數據。具體的聚類分析算法有很多種，這裡我們使用的是Density-Based Spatial Clustering of Applications with Noise (DBSCAN) 算法。

DBSCAN算法原理

DBSCAN算法是Martin Ester、Hans-Peter Kriegel、Jörg Sander和徐曉偉在1996年提出的，可以說是聚類分析的典型算法。DBSCAN遍曆所有的數據點，如果有很多相鄰的數據點的話就歸為一類。為了在DBSCAN算法中衡量數據點是否相鄰我們需要一個判斷距離的方法。這裡可視化了DBSCNAN算法運行的過程，如果感興趣的話可以看下。

使用DBSCAN算法尋找異常服務器

要找出有異常的服務器，我們先要指定一個指标，比如之前我們提到的錯誤率。接下來就要收集一段時序數據并使用DBSCAN算法來進行處理找出發生異常的服務器。比如下面這幅圖中塗成粉紅色的就是從Netflix時序數據平台中收集的部分。

netflix的技術（Netflix使用的異常服務器偵測技術）3

除了測量的指标，我們還需要指定将服務器标記為異常的最短持續時間。探測到異常之後就交由我們的報警系統來進行以下處理：

發郵件或者打電話聯系負責人
服務器下線但不停止
收集服務器數據以供進一步調查
停止服務器等待擴展系統進行替換

參數的選擇

DBSCAN算法中需要設置兩個參數:Eps和MinPts。意思分别是判斷數據點是否相鄰的半徑和定義一個集群所需要的數據點的最小個數。這裡我們的參數是根據現有的異常服務器數目使用模拟退火算法逆推出來的。這種逆推的方式簡化了參數的設置所以現在Netflix有好幾個項目組都在用我們這個系統。

為了對這個系統的有效性進行評估，我們已經在生産環境中進行了測試。我們一共收集了一個星期的數據，然後将人工識别出的異常服務器與算法識别出的異常服務器進行了對比。下面是測試的結果

這個結果顯示我們這個偵測系統雖然不是100%準确但是效果很不錯了。根據我們的自身情況來說也不用完全做到一點都不差，因為就算把一個正常運行的服務器給關掉了也不會對用戶體驗造成多大影響，因為擴展系統馬上就能加一個新的服務器進來。有這個偵測系統總是比沒有強吧哈哈。

現在我們的做法是收集一段時間的數據來進行偵測。因為不是實時偵測，所以效果就跟收集數據的時間長短有關：時間太短的話可能有噪音，太長的話偵測的速度又太慢。如果要對這套系統進行改進的話，可以考慮使用實時流式處理框架比如Mantis和Apache Spark Streaming。數據流挖掘和在線機器學習方面的研究也有一些進展所以如果你想建設一個類似的系統可以考慮下。

此外在參數的設置上也可以進行改進。可以進行數據标記來組織訓練數據并根據提供的訓練數據來對模型進行訓練，這種方法比我們現在用的逆推更好而且模型可以根據訓練數據的變化來重新訓練。

小結

Netflix的基礎設施變得越來越龐大，将運營中的某些決定(比如這裡的停止服務器)進行自動化可以提高可用性并減輕運維人員的負擔。夜魔俠的服裝能幫他打架，機器學習也能夠提高我們技術保障團隊的效率。偵測異常服務器隻是自動化的一個例子，其他可以自動化的機會還有很多，就留待大家去發掘吧。

英文原文：Tracking down the Villains: Outlier Detection at Netflix（譯者/劉旭坤審校/朱正貴責編/仲浩）

【預告】首屆中國人工智能大會（CCAI 2015）将于7月26-27日在北京友誼賓館召開。機器學習與模式識别、大數據的機遇與挑戰、人工智能與認知科學、智能機器人四個主題專家雲集。人工智能産品庫将同步上線，預約咨詢：QQ：1192936057。歡迎關注。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技軟件測試待遇
軟件測試待遇?薪資取決于：1、你的學曆背景；，今天小編就來聊一聊關于軟件測試待遇?接下來我們就一起去研究一下吧!軟件測試待遇薪資取決于：1、你的學曆背景；2、你的掌握技能；3、你的所在城市；4、你的溝通表達；現在軟件行業整體确實工資相對比較... 2022-12-12
科技你的手機和我一樣嗎
#健康科普大賽#手機啊！手機！“你是我的眼睛，讓我看見這世界就在我眼前”！手機啊！手機！你瞎了我的眼，讓我看不見眼前的世界！玩手機生活在這個時代裡，手機是生活中必不可少的工具，甚至工作也離不開手機。可是手機也傷害了不少人，比如小孩患上了“手... 2023-02-12
科技手機有什麼可怕的事情
手機有什麼可怕的事情?“手機病”你中了幾條手機像一把雙刃劍，在提供生活便利的同時，過度使用也會給我們的身體帶來問題網上衍生出的新名詞“手機病”，指的就是由于過度使用智能手機引發的一系列健康問題，包括肢體、視力的損害以及對大腦和心理的不良影響... 2023-01-21
科技抖音怎樣設置别人不能保存自己視頻
抖音怎樣設置别人不能保存自己視頻?打開抖音app，點擊右下方的“我”，在個人界面中點擊右上方的三道杠進入菜單；繼續選擇“傳作者服務中心”，找到并進入“視頻管理”，選擇要設置的視頻；點擊“權限設置”，将“允許他人下載完整視頻”開關關掉，這樣就... 2022-06-26
科技吃雞垂直同步開不開
吃雞垂直同步開不開?可根據電腦顯卡的配置選擇：高端顯卡玩要求低的遊戲，最好開啟；一般顯卡玩要求比較高的遊戲，最好關閉；高端顯卡玩要求高的遊戲，也是最好關閉；低端顯卡玩要求低的遊戲，開、關都一樣，我來為大家科普一下關于吃雞垂直同步開不開?下面... 2022-06-01
科技 windows10顯卡驅動失敗後怎麼...
微軟一直在設法改進Windows10的任務欄，但變化通常隻發生在自定義選項中，于是廣大用戶希望該公司能夠繼續這方面的工作，并在下一個大版本更新中引入更多功能。有趣的是，Windows10中存在一個非常讨喜的bug，甚至很多人呼籲将它作為Re... 2023-03-18
科技哪一個相親網站比較靠譜
哪一個相親網站比較靠譜?2022，相親交友，最靠譜的平台，來吧相親會為您服務，90%的人都在用，誠意找對象的來，相親會、相親，相親網，相親交友，全都在這裡，接下來我們就來聊聊關于哪一個相親網站比較靠譜?以下内容大家不妨參考一二希望能幫到您!... 2022-10-19
科技 cad怎麼統計圖塊數量
在CAD繪圖過程中，我們常常需要統計各類數據，如樓層門窗數量、不同設備名稱數量、花卉植物面積、某一區域周長等信息。那麼浩辰CAD軟件中怎麼統計CAD圖塊、文字及面積周長呢？無需安裝繁瑣的插件，浩辰CAD軟件提供了豐富的統計工具和應用，下面和... 2022-11-25
科技彈弓擊碎車玻璃盜竊
夜黑黑當人們都已進入夢鄉一雙罪惡的手伸向位于祥和商業廣場的一知名珠寶店犯罪嫌疑人先用彈弓打爛玻璃門潛入後再用彈弓擊碎櫃台玻璃将擺設在裡面的精美珠寶裝入早已準備好的袋内一盜就盜走價值30多萬元的珠寶……這是10月3日發生在雲南麗江的一起珠寶盜... 2023-03-10
科技蘋果手機登錄别人的id會怎麼樣
蘋果手機登錄别人的id會怎麼樣?蘋果手機登錄别人的id：某些服務會将視為同一個人如果針對iTunesStore與AppStore已購項目和某一家庭成員共用同一個AppleID，可能會遇到以下問題和其他問題：，下面我們就來聊聊關于蘋果手機登錄... 2022-06-15
科技微信裡的表情包怎麼保存到手
微信一直有一個很尴尬的問題，就是：“微信裡那些魔性的表情，隻能在聊天的時候鬥圖用，你想保存到手機，發個胖友圈和圍脖的配圖就沒辦法了~”幫哥哥曾用過各種喪盡天良的辦法想把表情保存下來，但微信堅守節操表示：隻可保存圖片及視頻到系統相冊我也曾迂回... 2023-01-04
科技 word怎麼插入視頻
word怎麼插入視頻?首先打開word文檔，在頂端菜單欄中點擊【插入】，點擊選項卡下【文本】組中【對象】下方的倒三角，我來為大家講解一下關于word怎麼插入視頻?跟着小編一起來看一看吧!word怎麼插入視頻首先打開word文檔，在頂端菜單欄... 2022-06-07
科技蘋果手機進水怎麼修理會不會很貴
手機不小心進水了，小編作為一名手機維修從業者幾乎每天都要遇到一兩台，手機進水了，可能你的手機會出現各種故障，比如不開機，發燙，相機打不開，WiFi打不開，無法充電，手機黑屏等故障，雖然iPhone也是官方經過ip68級防水測試的，但是如果你... 2023-01-11
科技 hide tools工具
hidetools工具?PrivacyHide是一款程序隐藏工具，如果你需要在電腦上運行軟件時不被别人發現，那麼可以去下載銀行獲取這款軟件它提供了一個非常強大的隐藏功能，可以從表面上徹底消除運行的痕迹軟件的使用對象是任意的，隻要用軟件的捕捉... 2023-02-12
科技蘋果app閃退怎麼辦
蘋果app閃退怎麼辦?在iTunes或iCloud上修複閃退蘋果手機有在iTunes或iCloud上有備份軟件的話，那麼可通過iTunes點擊“恢複備份”功能來恢複已經閃退了的軟件，下面我們就來說一說關于蘋果app閃退怎麼辦?我們一起去了解... 2022-07-25
科技手機壁紙高清巴紮黑
來源@吾皇的白茶-, 2023-02-26
科技天正t20v40軟件安裝教程
軟件下載方法溫馨提示：64位的天正T20V8.0支持CAD2010-2022，本教程以天正建築T20V8.0為例，電氣，暖通，給排水，結構安裝教程與此相同。1.打開下載好的軟件安裝包，鼠标有右擊壓縮包，選擇【解壓到當前文件夾】。2.等待壓縮... 2022-11-12
科技如何按撥号鍵查手機各功能
如何按撥号鍵查手機各功能?利用撥号鍵查詢通訊錄，利用九鍵輸入預存号碼的姓即可快速查詢到通訊錄電話，現在小編就來說說關于如何按撥号鍵查手機各功能?下面内容希望能幫助到你，我們來一起看看吧!如何按撥号鍵查手機各功能利用撥号鍵查詢通訊錄，利用九鍵... 2022-06-06
科技個人社保參保繳費證明怎麼開
社保新系統上線已經一段時間啦新系統上線肯定會有變化打工人＆參保人最關心、最常用到的個人社保參保證明怎麼打印呢？網頁端vs手機端全都有安排小夥伴們可按需選擇首先解鎖的是網頁版個人參保證明打印操作攻略↓↓↓相比網頁端的多重選擇小編更喜歡手機端的... 2023-01-21
科技迷你世界新更新的噴氣桶怎麼用
迷你世界即将迎來1.0版本，本次大版本更新，直接修改了非常多的内容，讓玩家們的遊戲體驗提升了非常多。當然，全新的大改版，也讓整個遊戲，和玩家們産生了一些隔閡。不少玩家會發現，自己此前的遊戲經驗，似乎沒有用了。不過并非一點用出都沒有了，其實仔... 2022-12-26
科技 cad基本繪圖命令怎麼用
在浩辰CAD軟件中，旋轉是最基礎的編輯命令，基本操作也沒有什麼難度，但相對比移動就複雜一些，而且有更多的技巧，對于很多CAD制圖初學入門者來說，這個命令也是需要掌握的，下面就給大家介紹一下CAD制圖入門學習之旋轉命令使用技巧。移動的常規操作... 2022-12-24
科技蘋果電腦用什麼錄屏
有時候，我們可能需要在蘋果電腦上進行屏幕錄制，比如制作一些軟件教程等等，可以通過以下2種方法進行錄制。現在越來越多的人選擇使用蘋果電腦了，特别是一些設計師、剪輯師等，因為它使用起來流暢性更好，因而得到越來越多的人的喜愛。那麼，在使用蘋果電腦... 2022-12-10
科技裝配式建築領域示範項目盤點
在現在的公建項目中也在大量應用裝配式建築的建造方式來進行施工，而且取得了不小的成績。裝配式建築是建造方式上根本性改變的創新，是一項建築業全面改革的重大舉措。《關于大力發展裝配式建築的指導意見》(國辦發[2016]71号)中也明确給出了我國發... 2022-12-24
科技陰陽師ssr輝夜姬怎麼培養
陰陽師這次推出的SP輝夜姬，估計不少玩家都已經抽到了，而對于這次的SP輝夜姬，因為技能升級帶來的一些效果，也出現了一個很獨特的養成偏門小技巧，根據目前的測驗還有實戰的檢測來看，目前技能喂到545的SP輝夜姬才是版本最強形态。目前SP輝夜姬在... 2023-01-11
科技昆明劫持學生擊斃現場熱點
2021年1月22日17時許，一名男子在昆明市五華區華山街道轄區東風西路雲南師範大學附屬實驗中學門口持刀緻傷7人後，劫持1名人質。接警後，昆明市公安局五華分局迅速調集警力趕到現場處置，對犯罪嫌疑人開展情緒疏導工作，昆明市公安局調集相關力量到... 2022-11-15
科技 u盤重裝系統不成功
U盤重裝系統現如今已經成為電腦重裝系統普遍使用的一種方式了。使用U盤重裝系統雖然也比較方便，但是在重裝過程中，也會遇到不少的問題，當大家遇到這些問題時通常會顯得有點手足無措。那麼此文韓博士小編就為大家帶來U盤重裝系統常見的三個問題及解決方法... 2023-03-18
科技聯想無線鼠标連電腦怎樣找型号
為何古老的電腦裡會有諸如掃雷、紙牌這樣的小遊戲？5月21日消息，聯想官方科普，Windows上最早的自帶遊戲是出現在1985年的“黑白棋”。随後1990年“紙牌”出現，因為當時還有很多用戶不熟悉圖形界面和鼠标的概念，通過拖動、釋放紙牌可以使... 2023-01-22
科技家庭安裝監控哪個更實用
如今人們的生活條件都好了，人們開始注重安防了，現在很多家庭都喜歡安裝監控，我覺得這是社會發展的産物結果，家庭安裝監控可以做到防護于未然，前段時間曝光的家庭保姆虐待小孩和老人等信息，如果不是家庭監控記錄到的話，那很多事還不為人知，家用監控的作... 2022-12-31
科技美妝蛋啥牌子的好用
哈喽，各位豬豬們好呀，這裡是你們滴鵝醬醬！前不久不是寫了“瑕疵皮怎麼打造清透無瑕底妝”嘛，那篇鵝醬說了用氣墊粉撲上妝會更好，因為能保持粉底原本的妝感和遮瑕度~但是我看了一眼評論區，好家夥，大家基本都是用美妝蛋上妝的！cr.圖蟲創意不過說實話... 2023-01-27
科技 gif動圖怎麼做成教程
視頻怎麼轉換成GIF？GIF即是圖形交換格式，也就是我們日常所說的動圖。往往一部影視劇大火，随之而來的就是與之相關的一系列好玩的動圖。而動圖在我們日常與好友的溝通中使用十分頻繁，使用搞怪好玩的動圖，不僅可以增加聊天的趣味性，而且可以拉近與好... 2022-12-31

tft每日頭條

> 科技

> netflix的技術

netflix的技術

相关科技资讯推荐

热门科技资讯推荐

网友关注