解讀特斯拉Autopilot的技術路線-tft每日頭條

解讀特斯拉Autopilot的技術路線

生活更新时间:2025-05-22 08:37:01

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）1

特斯拉是一家很開放的車企。

所謂開放，指的是馬斯克年初那一句「特斯拉願意開放并共享自己的所有專利」，還有在 GitHub 上公開了自家車機操作系統的底層代碼，以及在全球最大的軟件 BUG 讨論社區 Bugcrowd 裡面發下英雄帖，廣邀全球黑客黑自家系統。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）2

近日，特斯拉再一次将自家 Autopilot 的秘密向世界公開。特斯拉AI部門高級主管 Andrej Karpathy 近日出席了一個有關深度學習的會議——PyTorch Developer Conference 2019，并且進行了一段時長 11 分鐘的演講，主題就是 Autopilot 如何在計算機視覺深度學習中應用 PyTorch。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）3

衆所周知，特斯拉堅決不支持汽車界普遍力撐的激光雷達方案，而是堅持走純視覺識别路線，Andrej Karpathy 這次演講，等于用一種硬核的方式，再一次向世界宣戰。

我們将這次演講的精華部分摘錄下來，并以盡量簡練的語言解釋，于是就有了今天的文章。

什麼是 PyTorch？

要讨論 Andrej Karpathy 在這個視頻裡面說了什麼，我們先來搞清楚一個概念——PyTorch。

PyTorch 的「祖先」叫做 Torch（意思為火炬），Torch 是一個基于 BSD License 的開源機器學習框架，最早的 Torch 版本于 2002 年發布，主要應用于圖像和視頻類的深度學習，目前谷歌、Facebook、Twitter 都應用了 Torch 的分支版本。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）4

電動星球注：BSD License 最早在1988 年由加州大學伯克利分校起草，是目前給予使用者最高自由的開源協議，使用者基本上可以「為所欲為」地修改源代碼，并且将代碼打包成專有軟件。

至于 PyTorch，則是 Torch 使用 Python 語言編寫的版本。

Torch 的底層是由 C 語言和 Lua 語言編寫的，C 語言作為底層，而 Lua 語言作為深度學習庫，兩種語言都非常優秀，實際上目前仍然有很多大型企業采用 Torch 進行深度學習，比如上文提到的幾家。

2017 年 1 月， PyTorch 正式在 GitHub 上發布，号稱擁有更高的編譯和運行效率，而實際上它也做到了——靠的就是 Python 語言。

一句話總結一下 1989 年出生的 Python：常被戲稱為「膠水語言」，因為 Python 能夠基于其他語言的各種模塊結合到一起。根據權威數據挖掘網站 KDnuggets 的調查，Python 已經成為最受 AI 從業者歡迎的語言。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）5

基于 Python 語言的 PyTorch 框架，也同樣獲得了衆多企業和研究者的青睐。單說自動駕駛方面，除了特斯拉，Uber 也和斯坦福大學基于 PyTorch 研發出開源概率編程語言 Pyro。除此以外，Facebook、英偉達、美國艾倫人工智能研究所也都走在了 PyTorch 應用的前頭。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）6

特斯拉如何利用 PyTorch？

Andrej Karpathy 在演講的開場這樣說：「由于我們沒有采用激光雷達，也沒有采用高精度地圖，所以 Autopilot 的一切功能，都依賴于來自車身四周 8 個攝像頭提供原始圖像之後，再進行的計算機視覺運算。」

他随後給出了一張流程圖，裡面是 Autopilot 工作的所有流程，有趣的是，Andrej Karpathy将這一套流程稱為「Operation Vacation（操作假期）」，他說「因為現階段我的團隊已經可以在椅子上葛優癱，然後數據就會從特斯拉的車子上傳過來，在神經網絡模型上自己不斷循環運行」：

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）7

特斯拉AI部門令人豔羨的「假期」裡面，「PyTorch Distributed Training」占了單獨的一個部分——但憑什麼呢？

先上結論：特斯拉利用 PyTorch 框架效率更高的特點，不斷将 Autopilot 軟件的并行學習性能進一步提升。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）8

以上圖為例，在以上的典型場景内，Autopilot 需要同時處理 10 個不同類别的任務——而道路場景是極其複雜的，也就是說，Autopilot 時刻面臨着數十個任務并行處理的挑戰。Andrej Karpathy 的原話是「almost 100 tasks（幾乎同時處理 100 個任務）」。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）9

為了有效處理将近 100 個并行任務，特斯拉采用了「類 ResNet-50」的骨幹網絡。那什麼是 ResNet-50？

随着深度學習研究的不斷發展，深度學習神經網絡也在不斷加深，而随着網絡深度的上升，訓練準确度也會随之下降，ResNet 就是因此而生，它的中文名叫做深度殘差網絡。ResNet 有多個不同版本，包括 ResNet30/50/101 等，主要區分度在于 Layer 卷積層和 Block 區塊數量上，這裡就不展開了（畢竟是個汽車公衆号…）。

然而，即使采用了更高效的網絡，Andrej Karpathy 依然表示「我們無法讓每一個任務都享有單獨的神經網絡運算，因為同時處理的任務數實在太多，我們隻能把一些運算分攤到共享骨幹網絡上」。

Andrej Karpathy将分攤到共享骨幹網絡上的任務稱作「Hydra Nets（Hydra 意為九頭蛇）」，中二之餘又不失準确。比如說下圖高速公路上行駛時的物體識别：

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）10

還有 Smart Summon 模式下道路邊緣的識别與确定：

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）11

Andrej Karpathy 将這種類型的計算稱為「在圖像中進行預測，以空間和時間為維度将這些圖像有選擇性地部分删除，同時通過圖像拼接和變換，以此讓車輛明白現在所處的位置」：

另一個依賴 PyTorch 提升運行效率的，叫做 Recurrent Tasks。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）12

Recurrent Tasks 是來自于 RNN 的運算任務，中文名有兩個，有的翻譯成循環神經網絡，更主流的譯法是遞歸神經網絡，因為 RNN 有兩個算法變體——一種是時間遞歸神經網絡（recurrent neural network），另一種是結構遞歸神經網絡（recursive neural network），兩者的縮寫都是 RNN。

RNN 聽起來雖然很陽春白雪，但它已經在實際應用中為我們默默服務了很久——機器翻譯、語音識别、生物研究中的 DNA 序列分析，都應用了 RNN 運算。而在自動駕駛中，RNN 通常被應用在前方道路預測中。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）13

Andrej Karpathy 舉了以上的場景做例子，解釋 Recurrent Tasks 提升效率之後，對 Road Layout Prediction（道路層預測）的重要性：

「我們給每台攝像頭都配備了相應的 Hydra Nets，但很多時候你需要同時采集多個攝像頭的數據，然後再進行運算。比如說在過一個三岔路口的時候，我們有三個攝像頭同時為這個場景的深度學習運算輸入圖像數據。此時的神經網絡預測就不再隻是單純的圖像識别，而是基于總-分結構的複合運算。」

談到這個場景的時候，Andrej Karpathy 順便以此為例子，對Hydra Nets給出了進一步的解釋：

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）14

「我們為所有的計算任務準備了 8 個 HydraNets，當然所有 Hydra Nets 的運算任務都可以進一步進入 RNN 做遞歸運算。然後我們可以按照這樣的總-分結構做輸出。也就是說，Autopilot 軟件裡面有一個大型的單一計算網絡，然後每一個任務都可以分采樣這個計算網絡（接收到的圖像）的一小部分，然後訓練那一小部分的神經網絡。」

「比如說，我們可以單獨訓練攝像頭的障礙物探測功能，或者是色彩深度網絡，又或者是道路布局網絡。所有單一任務都分采樣了圖像數據的一小部分，然後單獨訓練那一部分（的神經網絡）」。

接下來，Andrej Karpathy 用了一張圖展示了 Autopilot 軟件需要處理的圖像數據量：

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）15

乍眼一看，這張圖裡面隻有兩個數字是可以望文生義的：代表原因的8個攝像頭和代表結果的 4096 幅圖像。而其中的過程則相當複雜。

Time steps 和 Batch size 需要一起講，沒有寫中文是因為現在的深度學習界依然沒有給它們一個比較信達雅的官方翻譯。其中 Batch size 代表了在深度學習網絡中單一批次的數據數量，比如我們往一個 RNN 裡面輸入 100 條數據，分成 10 個 Batch，那 Batch size 就是 10。

至于 Time steps 則是預測最終值需要的最大「步數」，比如說 Autopilot 軟件的 Time steps 是 16，也就是說每次會生成 x0-x15，一共 16 組數據，最終預測結果——每次，指的就是圖中每一個「Forward pass」。

目前深度學習最熱門的硬件是 GPU，Andrej Karpathy 則用了一張圖來描述 Autopilot 神經網絡對于 GPU 運算的要求有多高：

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）16

在圖中顯示的 70000 GPU Hours，表示Autopilot深度計算網絡如果用單一GPU運算需要用到 7 萬小時——Andrej Karpathy 的原話是「如果你用一組 8 個 GPU 去訓練 Autopilot 的深度運算網絡，你得花一年」——當然他沒說用作對比的是什麼 GPU。

最後，Andrej Karpathy 例牌吹了一波自家的 FSD 芯片，特斯拉的 11 分鐘炫技至此全部結束——但這一次的 PPT 和 4 月份發布時有所不同，硬件 3.0 的工作功耗不再用250W/英裡這樣的單位定義，而是換算過來更低的「Sub 100W（低于 100W）」——至于是不是特斯拉式神優化，我們隻能等 FSD 芯片大規模裝機之後才能知道了。

解讀特斯拉Autopilot的技術路線（解讀特斯拉Autopilot的技術路線）17

結語

今天 Andrej Karpathy 的演講，雖然不太準确，但我們可以嘗試用一句話概括——特斯拉很希望把你的車變成一個人。

今年 4 月份 FSD 芯片發布的時候，Andrej Karpathy 說過一句話，宣布了特斯拉與激光雷達徹底絕緣：「你會開車是因為你的眼睛看到了路況，而不是你的眼睛發射出激光」。今天，Andrej Karpathy 也說了「我們不用高精度地圖」。

于是，一輛逐步走向自動駕駛的特斯拉，在行為模式上會變得越來越像人——用眼睛收集圖像數據，然後用大腦判斷自身所處環境，指揮四肢做出行動。

特斯拉的邏輯似乎更接近人類本能，但卻是汽車界實打實的少數派。傳統汽車界，包括造車新勢力，都對激光雷達和高精度地圖抱有更高的信心。

蟹老闆上周體驗小鵬 P7（詳見《武裝到牙齒的小鵬 P7，能打赢特斯拉Model 3？》）的時候說過這麼一段話：

「超視距實時在線，這是我們認為小鵬 P7 在自動駕駛方案上與特斯拉最大的不同。某種程度上，你可以将特斯拉看成桌面端或者單機的，将小鵬 P7 看成是移動端或者聯網的。」

特斯拉已經在純視覺方案這條路上越走越遠，但馬斯克真的是對的嗎？（毓肥電動星球News）

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活杜甫自号什麼
杜甫自号什麼?杜甫号少陵野老，字子美，是唐朝著名的現實主義詩人由于杜甫處在大唐由盛轉衰的時期，所以他的詩作多是關心天下蒼生，憂思家國大事為主，他在唐詩上的成就不輸李白，李白有“詩仙”之稱，而杜甫被世人尊稱為“詩聖”，我來為大家講解一下關于杜... 2022-05-31
生活空調冬天不制熱有幾種原因
空調是家裡常見的家用電器，空調冬天帶給我們溫暖，夏天帶給我們涼爽，是一件非常實用的家用電器。在冬天的時候，有很多小夥伴會發現，空調制熱的效果不是很好，這一一定是有原因的。那麼，空調不制熱的原因有哪些呢？如何選購空調呢？下面實陽機電就為大家具... 2023-01-20
生活貝親第三代奶瓶真假對比
都說小兒難養，确實不假。衣食住行，吃喝拉撒，哪個不是大問題。就拿奶瓶來說吧，面對市面上多如牛毛的品牌，到底該如何選擇?今天，我們就帶來貝親玻璃奶瓶實測，告訴你它到底值不值得買!我們都知道，市面上的奶瓶分為玻璃、矽膠、塑料材質，本次評測的貝親... 2022-11-08
生活關于愛護牙齒的資料
關于愛護牙齒的資料?養成良好的口腔衛生習慣應選用符合全國牙防組織推薦的牙膏及牙刷每天刷牙2-3次，晚睡前的一次必不可少在來不及或不方便刷牙時，可用漱口代替，在某些特殊場合裡，可用湯或茶水漱口，以保持口腔清潔，我來為大家科普一下關于關于愛護牙... 2022-06-10
生活情人節送女孩的禮物有哪些
情人節送女孩的禮物有哪些?香水：性感女神瑪麗蓮夢露曾說，夜晚，我隻穿香奈兒五号入睡啧啧聽聽這話，多麼的撩人香奈兒小姐也曾經說過，一個不噴香水的女人沒有未來香水雖然并不是生活的必需品，但是它代表的是女人對于生活品質的追求，直男癌可能不太明白，... 2022-07-09
生活适合農村的取名抖音
适合農村的取名抖音?農人小風憶鄉人，接下來我們就來聊聊關于适合農村的取名抖音?以下内容大家不妨參考一二希望能幫到您!适合農村的取名抖音農人小風憶鄉人村裡的故事那山那牛小山故事田間地頭小溪潺潺山村生活野果食記柿子樹瓦片上的青苔竹筒茶山野間谷子... 2022-07-31
生活西瓜醬測評
又到了激動人心的西瓜醬一周心動pick的時間！快來看看有哪些精彩作品吧～感興趣的小夥伴可以點擊标題鍊接，去支持你喜歡的作者噢！本期pick的五位優質創作者，請耐心等候西瓜醬帶來的10w流量獎勵哦!1.有多少人在幫鳴人搓螺旋丸？共計27人，最... 2022-11-18
生活 65寸電視可以當顯示屏嗎
我一直嫌棄手機平闆電腦的屏幕都小打遊戲都不是很快樂！直到我看到東芝推出的遊戲電視東芝遊戲電視Z570KF真的是我的心頭愛了~是為電競女孩們準備的沒錯了！⭕Z570KF遊戲試聽有多牛·東芝火箭炮音響開場就震撼，一秒沉浸式進入遊戲！搭配bazo... 2022-12-07
生活春天這食材不貴碰到别錯過
導讀：又到了一年一度外出摘野菜的時候，比如在春天，很多人都會摘野蔥、荠菜、香椿、蒲公英、水芹菜等等野菜，而在這些野菜中，荠菜的味道是最為鮮美的，也是很多人容易接受的。而荠菜也是營養價值非常豐富的一種野菜。根據研究，荠菜中含有豐富的鉀、鈣、鐵... 2022-11-26
生活廣州有什麼祛濕氣的涼茶
夏天到了，現在的天氣也是真的的很熱，是不是有人就很怕上火或者是喉嚨不舒服等等，但在廣東這些都不是什麼大問題，來一碗涼茶就搞定的事，涼茶是有降火的一個功效的，而且到真正天氣非常熱得時候一周喝幾次涼茶也是有的，但還是要看自己的一個身體狀況來喝，... 2022-12-31
生活白居易的詩歌有哪些
白居易的詩歌有哪些?《憶江南·江南好》江南好，，現在小編就來說說關于白居易的詩歌有哪些?下面内容希望能幫助到你，我們來一起看看吧!白居易的詩歌有哪些《憶江南·江南好》江南好，風景舊曾谙。日出江花紅勝火，春來江水綠如藍，能不憶江南？《憶江南·... 2022-08-20
生活手工牛軋糖的做法
手工牛軋糖的做法?食材：棉花糖150g、去皮花生150g、奶粉100g、黃油30g，接下來我們就來聊聊關于手工牛軋糖的做法?以下内容大家不妨參考一二希望能幫到您!手工牛軋糖的做法食材：棉花糖150g、去皮花生150g、奶粉100g、黃油30... 2022-07-06
生活花開花落又一春
花開花落又一春?花開花落又一春不知人在夢中何處尋？桃花依舊笑春風陌上，楊柳青，青綠色惆怅又是夢中一春又一春，現在小編就來說說關于花開花落又一春?下面内容希望能幫助到你，我們來一起看看吧!花開花落又一春花開花落又一春。不知人在夢中何處尋？桃花... 2022-11-10
生活除鏽用什麼方法最好
除鏽用什麼方法最好?白醋除鏽醋能與金屬上的鏽起化學反應，将之分解把白醋倒在鏽迹上面，然後等待一會，用抹布擦淨即可，我來為大家科普一下關于除鏽用什麼方法最好?下面希望有你要的答案，我們一起來看看吧!除鏽用什麼方法最好白醋除鏽。醋能與金屬上的鏽... 2022-08-23
生活線上線下的産品有什麼區别
線上線下的産品有什麼區别?價格不同：相近類型的産品線上比線下實體店價格低，今天小編就來說說關于線上線下的産品有什麼區别?下面更多詳細答案一起來看看吧!線上線下的産品有什麼區别價格不同：相近類型的産品線上比線下實體店價格低。質保不同：線下實體... 2022-06-28
生活劉雯的拍照風格
機場早已淪為了女星們的秀場之一，即使工作多忙也不忘在機場凹造型，前前後後更是圍滿了攝像頭，讓旁人看了歎為觀止。不過即使機場街拍的風潮再大，也始終有一些人更追求務實，劉雯便是其中之一。雖說身為國際超模，但每次亮相機場都是那麼親切，近日她還穿... 2022-10-29
生活稅務專碩可以調劑到哪些專業
稅務專碩可以調劑到哪些專業?稅務專碩能調劑到專業有：金融碩士、應用統計碩士、國際商務碩士、保險碩士及資産評估碩士等屬于經濟類聯考綜合能力的專業，其他專業不可以，接下來我們就來聊聊關于稅務專碩可以調劑到哪些專業?以下内容大家不妨參考一二希望能... 2022-06-07
生活豌豆莢要怎麼使用
來人人都是産品經理【起點學院】，BAT實戰派産品總監手把手系統帶你學産品、學運營。豌豆莢的「通知清理」一經推出，便引起了廣泛讨論。通知欄作為重災區，下拉通知欄稍不注意就會被各種通知推送淹沒，為了解決這一需求痛點，目前也有幾家做的比較好的通知... 2022-11-18
生活西安高校新校區都有哪些曆史遺迹
随着2022年高招錄取持續推進莘莘學子們懷揣着夢想和期待即将開啟嶄新的大學探索之旅西安作為全國知名的高等教育重鎮始終敞開懷抱迎接來自各地的年輕人在這裡揚帆逐夢！奮楫笃行！想知道這些高校有多“忒色”嗎？馬上揭曉01教育資源一流西安高校林立坐擁... 2022-12-17
生活求生之路2地圖放哪
求生之路2地圖放哪?打開放求生之路2的文件夾，如果你不知道遊戲裝在哪裡了，打開steam找到求生之路2，右鍵打開屬性，選擇浏覽本地文件夾，就到了求生之路的根目錄了，接下來我們就來聊聊關于求生之路2地圖放哪?以下内容大家不妨參考一二希望能幫到... 2022-06-02
生活蘋果新機11月價格
【手機中國新聞】9月8日淩晨，蘋果召開新品發布會。在發布會結束後，蘋果官網也立馬更新了相關産品内容，新品的國行價格也全部出爐。iPhone14ProiPhone14售5999元起（同去年iPhone13）128GB售價5999元256GB售... 2022-11-12
生活翻來覆去的意思是什麼
翻來覆去的意思是什麼?翻來覆去，漢語成語，拼音是fānláifùqù，意思是形容一次又一次來回的翻動身體，下面我們就來聊聊關于翻來覆去的意思是什麼?接下來我們就一起去了解一下吧!翻來覆去的意思是什麼翻來覆去，漢語成語，拼音是fānláifù... 2022-06-10
生活老子道德經全文
老子道德經全文?《道德經·第一章》作者：老子，朝代：春秋，我來為大家科普一下關于老子道德經全文?下面希望有你要的答案，我們一起來看看吧!老子道德經全文《道德經·第一章》作者：老子，朝代：春秋。原文：道可道，非常道；名可名，非常名。無名，天地... 2022-08-07
生活怎樣制作桑葉茶
怎樣制作桑葉茶?采桑桑葉茶的原料，采摘回來的桑葉，要注意挑選篩檢，去除部分殘破老葉，隻留芽頭嫩葉用清水浸泡5分鐘，再沖洗兩次，去除灰塵雜質，洗淨後放于陰涼區晾幹水分備用，今天小編就來聊一聊關于怎樣制作桑葉茶?接下來我們就一起去研究一下吧!怎... 2022-06-21
生活京東e卡使用規則有哪些
想必大家都知道京東商城，它是唯一可以與淘寶抗衡的平台。京東隻是做平台，商品都是由商家提供，不過商品的審核會比較嚴格，所以商城的商品質量還是有保障的。京東也特别人性化，為了方便大家購物，推出發行了預付型購物卡，也就是京東e卡。但是，京東e卡隻... 2022-10-27
生活 iphone屏幕放大了怎麼關掉
iPhone屏幕突然變得超大，不知道發生甚麼事嗎？相信有些使用者曾遇過iPhone用一用忽然無法滑動，并且開始說話，或是畫面上出現一個放大框框或整個屏幕變超大，其實這不是故障了，而是我們不小心誤觸開啟了iPhone内建的輔助功能，當遇到上述... 2023-01-14
生活咖啡的保質期一般是幾年
咖啡的保質期一般是幾年?進口咖啡是2年保質期，國内烘焙咖啡是1年保質期咖啡除了豆子的品種和烘焙技術外，儲藏方式也很重要要注意防潮，防曬，避免高溫直射，咖啡适合放在陰涼處如果儲存的好，咖啡沒有受潮或是變味的話，一般是沒有大問題的當然如如果你拆... 2022-06-02
生活松山湖新時代文明實踐
東陽市“浙風十禮·從我做起”新時代文明實踐倡議書親愛的市民朋友們：文明是一座城市的内在氣質，賦予城市發展生生不息的力量。“務實、守信、崇學、向善”已成為當代浙江人的共同價值追求，每位浙江人都應成為“浙江有禮”的代言人。在此，市文明辦向全體市... 2022-12-03
生活運動bra是什麼意思
運動bra是什麼意思?女性的束胸衣借用了這一詞彙而已，我來為大家科普一下關于運動bra是什麼意思?下面希望有你要的答案，我們一起來看看吧!運動bra是什麼意思女性的束胸衣借用了這一詞彙而已。bra指的是純棉文胸，帶有法國蕾絲花邊的，一般裡面... 2022-07-01
生活怪誕的意思
怪誕的意思?荒唐古怪現代文學藝術的一種特殊創作手法即用現實生活中不可能發生的怪異事物表現現實生活，形成強烈的對比，以表現生活本質例如，卡夫卡的《變形記》寫主人公突然變成了大甲蟲，引起了一家人的情感變化，表現現代社會的人性異化，今天小編就來說... 2022-05-31

tft每日頭條

> 生活

> 解讀特斯拉Autopilot的技術路線

解讀特斯拉Autopilot的技術路線

相关生活资讯推荐

热门生活资讯推荐

网友关注