愛因斯坦有曰,“瀚宇初開,萬物當生也。萬物可謂振動,能光旋律之蕩漾焉。”(注:作者中譯)。AI新技術革命時代,大算力芯片也撥響了自動駕駛ADS的琴弦。大珠小珠般的AI算法在大算力驅動下應運而振,應時而動,解決了ADS從L2到L5逐級演進中的衆多技術難題。ADS每增加一級,算力需求也會呈現十倍速上升,L4級别可預計的算力需求在1000TOPS,L5級别估計在2000-10000TOPS。如圖1所示,後摩爾時代工藝更新性能提升放緩,延續性創新的邊際效益遞減,新興的大算力架構在不斷湧現,加上駕駛AI算法高速叠代演進,在未來5-10年内可能會為後來的技術追趕者提供非常奇妙的一個直線超車的機會窗口。
圖1. 大算力時代自動駕駛ADS領域的機遇與挑戰
當前ADS自動駕駛采用決策層後融合的方式,其局限性主要表現在在極端惡劣氣候與複雜遮擋等不确定性場景下分别進行單模結構化信息提取後再進行融合決策,每個通道信息會有不同層面丢失,很難能夠進行多模有效互補與特征提取共享,算力内卷且性能遠低于預期。
未來ADS算法會進入一個全新的2.0階段,4D空間下基于時空的多模感知與融合推理, 也就是特征提取/統計推斷/應急預測相結合,實現在動态複雜的有噪聲幹擾等場景下,全程安全無碰撞的高效行駛。挑戰可以體現在,動态随機的人車物交互,多變天氣路況,以及突發交通事件
ADS算法2.0從決策層後融合走向特征級前融合,當前行業ADS2.0算法主要演進方向為:
多模感知:主要是針對Camera/LiDAR/Radar海量數據流進行特征提取,DL網絡主流趨勢是卷積CNN或者貝葉斯NN Transformer的組合架構,在統一的特征空間實現多模感知,特征融合共享以及多任務來提升算力的整體效率。
融合推理:主要是基于模型與基于數據的雙
ADS2.0算法演進與對算力的新需求,可以總結為:
演進趨勢1:感知定位預測決策控制模塊化處理流程中, 從決策層後融合走向感知層前融合,算法能夠在統一空間支持多模融合,多任務共享;
演進趨勢2:預測與規劃聯合建模,從可獲得的Off-policy數據進行學習,能夠自學習處理不确定性下的安全性問題,解決可解釋問題,持續學習解決新場景問題;
算力新需求:從compute-bound(矩陣-矩陣乘)走向memory-bound(矩陣-矢量乘),從偏計算走向偏存取。
當前市場上主流算力NPU芯片,都存在幾個共性問題,一是算法效率低,多數隻針對CNN(例如3x3卷積)優化;二是内存牆問題:處理單元PE存算分離,數據共享難;三是能耗牆問題:數據重複搬移,耗能增加>30-70%。所以,當前針對某些特定算法的芯片,無法解決未來ADS 2.0的需求。
從工程實踐上看,ADS 2.0算法需通過“硬件預埋,算法叠代,算力均衡” ,提供一個向前兼容的解決方案,以通用大算力(CPU的5-10倍性能提升,NPU的100-500倍性能提升)來解決未來不确定性的算法演進:
底層架構的演進:從存算分離過渡到近内存計算,最終走向内存計算;
數據通道與模型:高速數據接口;數據壓縮 模型壓縮 低精度逼近計算 稀疏計算加速;
并行的頂層架構:模型-硬件聯合設計,以及硬設計可配置 硬件調度 軟運行可編程調度引擎。
未來,自動駕駛算法不會止步于ADS 2.0,而能夠真正支持人類自動駕駛夢想的算法ADS 3.0趨勢,我們估計會采用一個DNN網絡來進行端到端學習。設想一下,有足夠的專家駕駛數據用來做模仿學習或采用RL自學習模式,可以有效降低數據标注的信息瓶頸與嚴重依賴,從而能夠從多模多樣化數據層面進行非直接的推理或者博弈類的對抗學習。ADS 3.0目前來看模型的ADS系統的總體演進趨勢,可以總結為:
場景演進:負載多樣性
➤ 從數量有限的攝像頭設置走向 Camera LiDAR Radar 多模态組合。
趨勢演進:算法多樣性
➤ 從CNN Rule-based方案走向CNN, RNN, Transformer, GNN, Bayesian, Deep Reinforcement Learning, Dynamic DNN, NAS Generated DNN, Variably Quantized DNN多算法組合。
大算力時代,ADS系統首先是模仿人類的駕駛行為,通過注意力機制,期望在感知定位預測規劃控制領域提供遠超人類的決策能力。這需要我們在AI的三要素(算法、算力、數據)基礎上添加第四要素,知識或者常識。
而上述要素,均需要在充分理解算法的快速叠代的大趨勢下,擁有充足的超大通用算力,ADS系統在離線模仿學習人類駕駛先驗知識經驗與規則的基礎上,能夠提供在線自主學習能力,通過自學習激勵與博弈共赢策略應對衆多不确定性的人機交互的複雜環境,能夠對決策不充分的場景下做到安全應對和提供可信解釋能力。此外,大算力芯片也需要能夠通過額外的算力,對芯片内百萬級的并行計算單元提供故障檢測與安全規避能力,對大量多模傳感器的部分或者完全失效進行有效檢測與應對決策處理,對駕駛環境針對傳感器的主動攻擊與外界目标非主動幹擾進行有效檢測與實時決策處理。
本文來源:佐思汽車
作者:Dr. Luo,東南大學工學博士,英國布裡斯托大學博士後,是複睿微電子英國研發中心GRUK首席AI科學家,常駐英國劍橋。Dr. Luo長期從事科學研究和機器視覺先進産品開發,曾在某500強ICT企業擔任機器視覺首席科學家。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!