tft每日頭條

 > 教育

 > 人工智能在自動駕駛技術中的作用

人工智能在自動駕駛技術中的作用

教育 更新时间:2024-07-24 23:25:12

文 | 秦明;編輯 | 石亞瓊;來源 | 數字時氪(digital36kr)

從80年代跨越到90年代,相比于知識工程與專家系統,人工神經網絡不溫不火,很多人認為它并沒有什麼實用價值。

1992年8月,鄧志東進入清華大學從事博士後研究,主要做基于人工神經網絡的誤差反向傳播算法的性能改進,以及強化學習等方面的研究。

他回憶到,那個時候專家系統嚴重依賴于人工設計、缺乏學習能力等局限還沒有被人們完全意識到。計算機的算力與性能也不能支撐大型神經網絡模型面向大規模數據集的訓練與推斷,人工神經網絡也幾乎不能應用于圖像處理與計算機視覺領域。

突破與創新不斷出現,也是在1992年,李開複設計了支持語音識别的語音助理,即Siri的前身;IBM的AI“深藍”機器人于1997年第一次戰勝了國際象棋冠軍卡斯帕羅夫……

自1994年留校以來,鄧志東做了很多領域的研究,包括自學習控制、移動機器人技術、神經網絡、強化學習、複雜網絡理論、虛拟現實、計算生物學、無線傳感器網絡、計算神經科學、自動駕駛技術等。不知不覺中,他已經在人工智能領域探索了30個年頭。

時代的進步,曆史的偶然。上世紀的邊緣探索,如今看來已經成為主流并引領未來。

2012年,以深度神經網絡為代表的AI技術飛速發展,各大科技巨頭紛紛湧入,押注人工智能的未來。2015年,以深度卷積神經網絡為核心的計算機視覺技術拉開感知智能時代的序幕;2019年,以大模型為代表的自然語言方向讓AI跨入新的時代。

鄧志東告訴36氪,每一項技術突破的背後都有一群追求真理的科學家,以及面向落地應用場景的大量嘗試性探索。自動駕駛是他近10年多的重點研究領域,也是目前最有技術挑戰的落地應用場景之一。

核心技術難點之一在于汽車如何去理解複雜的動态駕駛場景(DDS),保證自動駕駛的安全性。

鄧志東表示,人類駕駛是建立在認知理解基礎之上,依靠可理解的視覺感知和大腦實現決策;相比之下,自動駕駛難以在複雜動态環境中獲得人類水平的駕駛知覺、預測與認知判決能力。

也就是說,它難以對道路、路口、停車位以及各種交通參與者複雜變化行為所組成的一幕幕動态場景,做出滿足安全性要求的綜合性的關聯感知、趨勢預測與自主判決。

想真正意義上實現自動駕駛,還需不斷從基礎理論、軟硬件與系統、政策、法規、倫理、生态等層面完善與突破。

那麼當下自動駕駛技術發展的現狀和瓶頸是什麼?科學家團隊正在解決哪些關鍵技術問題?市場中大家的共識與分歧是什麼?未來還有哪些商業機會?以及産學研過程中有哪些問題要解決?

近期,在第一屆專精特新技術創新大會暨科學家創新創業論壇前夕,36氪數字時氪專訪了清華大學人工智能研究院視覺智能研究中心主任鄧志東教授,聊了聊上述問題,他結合過往觀察給出了心中的看法。

人工智能在自動駕駛技術中的作用(30年AI技術研究)1

清華大學人工智能研究院視覺智能研究中心主任 鄧志東教授

01 談瓶頸:複雜場景的不可理解性

2009年初,在國家重點項目的支持下,鄧志東開始了自動駕駛技術研究——視聽覺信息的認知計算。走過很多彎路,踩了很多坑,這是鄧志東對過去的一些描述。

鄧志東團隊是國内最早使用純視覺方法進行自動駕駛技術研究的團隊之一。他談到,當時主要是基于攝像頭、激光雷達、毫米波雷達等視覺感知設備,進行駕駛場景與目标的感知,同時陸續從硬件、算法、軟件、系統集成、路測,甚至車輛改裝層面做了大量技術探索。

改裝日産奇駿、别克昂克雷,利用長安CS 35與CS 55全線控車,從自動駕駛原理性、技術性驗證到後面的路測實驗樣車,鄧志東至少主持研發了4台自動駕駛汽車。

天天做實驗,壓力巨大,是團隊常有的狀态。那時團隊走遍了北京的東南西北邊緣地帶(北面的北清路、溫泉地區,西面的世博園,南面的良鄉,東面的燕郊),也在北京的5、6環,以及G7高速公路的部分路段進行了閉環測試。

鄧志東回憶到,當時國内自動駕駛普遍采用循線方法,為了驗證基于視覺自主感知的駕駛效果,團隊直到2014年,一直沒有使用任何厘米級精度的RTK差分GPS以及高清地圖。

剛開始研究時,深度學習還沒有發展起來,采用傳統的計算機視覺方法,漏檢誤檢會比較多,僅可做到70%-80%的準确率,而且程序實現中還加了很多阈值邏輯,通用性與環境适應性不好。鄧志東告訴36氪,那時候承受了極大的壓力,一切都需要摸索中。

如今,基于深度學習的視覺感知方法在性能上有了突破,但與正常成年人類駕駛相比,在感知上仍有很大的差距。

行百裡者半九十,自動駕駛是典型的長尾應用場景。相比于人類駕駛平均10萬公裡才會有一次小的事故,目前L1、L2級别的自動輔助駕駛對應的路測裡程數最低要求在20萬、100萬公裡。

鄧志東談到,目前自動駕駛的難題在于感知的不安全與不可靠性,核心是對複雜場景與目标的不可理解性。過去研究與實踐中大多僅孤立考慮單一實體屬性,如單個目标本身的檢測、分割、跟蹤與識别,以及軌迹補全、行為預測等,如今需要關注不同目标實體之間相互關系的學習理解,在時空相互關系中去理解特定的目标。

5個9或99.999%的識别率已經是比較好的狀态了,但要想真正解決安全性,漏檢誤檢率還是要小于十萬分之一或百萬分之一,也就是需要7個9或8個9,利用數據驅動方法很難達到這麼高的精度。

鄧志東告訴36氪,這是乘以10萬公裡仍有1次或0.1次漏檢的客觀應用需求。因此繼續往深處走,需要的是算力與數據的指數級增長,但關鍵還是算法颠覆性的創新。

車聯網V2X、車路協同也是市場關注的熱點。安全避險是強驅動力,鄧志東表示,除非網聯或協同能聚焦賦能關鍵性安全問題的解決,若僅是解決舒适性功能,則可能會額外增加不安全因素,也會造成投入産出的失衡。

總之,當前國内的技術研究與特斯拉的單車智能還是有不少差距,國内企業應該抓一些基礎技術問題的突破,一方面需要自上而下加大資本、人力等投入;另一方面市場也要給予初創企業更多的時間。

02 談突破:多目标關系的語義理解

自動駕駛的發展是深度學習、AI芯片、标簽大數據、場景應用等技術的混合産物,是一種偶然,也是一種必然。

國内最早是在1992年,國防科技大學研制的第一輛無人駕駛實驗汽車;2016年之前,我國自動駕駛處于科研主導、産業探索初期;2016年是一個爆發點,大量資本湧入,科研主導逐漸演變為市場主導,巨頭卷入,自動駕駛創新企業迎來蓬勃發展。

那一年,滴滴組建自動駕駛團隊,小馬智行與Auto X也相應成立;随後專注于RoboTaxi和商用車應用場景的景馳、Roadstar、文遠知行、元戎啟行、輕舟智航也相繼入局,自動駕駛的風口開啟。

如今,伴随着RoboTaxi批量商用落地,自動駕駛商業路徑呈多元化發展。

市場層面上,目前乘用車量産車型已實現的自動駕駛功能主要集中在L2級别,個别車企在推進L2 、L2 級别,但還未有L3級别的躍進;在部分商用封閉場景,如港口、礦山以及RoboTaxi,自動駕駛公司選擇從L4級别開始發力,尋求跨越式突破。

鄧志東談到,低速L4更多的是商業模式的創新。然而是否需要經曆L3這個過程,行業仍是有争議的,傳統車企基于安全性與成本的考量,希望有循序漸進的過程,但由于L3相關政策、法規比較難推進,跨界的科技企業期望直接跨越到L4。

人類駕駛是利用認知指導、在語義理解基礎之上完成汽車的動态駕駛任務(DDT)的。

語義本質是一種知識,是人類可理解與可交流的,包含的信息豐富多樣。在知識邏輯體系裡面,不能違背常識。違背了語義關系,就是違背了常識。在自動駕駛語義環境中,機器要學會去理解自車與道路、他車、行人、信号燈、交通标識之間的關系,需要利用常識去解決長尾問題,并做出最優的預測、決策與規劃。

目前,多目标實體相互關系的語義理解是鄧志東團隊正在突破的課題之一。

具體包括在基于數據驅動的視覺深度學習模型中,如何增加對規則節點的學習,對關系的學習,對知識推理的應用,使得新一代人工智能模型具有可解釋性與高魯棒性。鄧志東談到,團隊正嘗試将黑箱模型轉變為灰箱或白箱,盡管單段模塊本身可能是黑箱,但若實現塊與塊之間的邏輯連接與可解釋性,則有非常大的研究與應用價值。

舉一反三的少樣本與跨模态、跨場景的學習能力也是其中研究的重點。不同于過去二維圖像、三維點雲等低維原始數據的聚類方法,鄧志東團隊目前聚焦在高維特征空間上的深度無監督學習與深度自監督學習,力圖引入知識及知識推理來解決小樣本學習、跨場景學習問題。

他舉了一個很形象的例子,比如隻給AI模型看5隻不同形态的“标簽”貓,其他類型的貓僅靠機器自動用深度聚類方法尋找标簽學習,已經是完全可以做到的,且進展非常大。

鄧志東告訴36氪,人與人之間、人與環境之間以語義彼此交流,本質是相互間可以理解、不違背常識,自動駕駛應該關注目标的内涵、外延及其與彼此之間的語義交互關系。

當然,數據驅動與知識驅動的結合已成為共識,科學研究過程中既要有數據驅動的黑箱,也需要知識驅動的白箱,兩者在邏輯上互相關聯,具有可解釋性。

03 談創新:科技成果難以直接轉化成産品

2016年市場開啟時,創始玩家多為高校出去創業的學生,鄧志東回憶到,電動化首先帶來一波沖擊,随後傳統車企被迫卷入,其次智能化又引起更大的沖擊。蔚小理等研發新能源汽車增加智能化也是市場需求,趨勢明顯。

自動駕駛産業鍊可分為硬、軟與系統等,主要包括車載攝像頭、激光雷達、4D成像毫米波雷達、高精度定位定姿設備、AI芯片、計算平台、域控制器、執行機構、底盤、AI超算離線訓練平台、5G移動通信設備、邊緣計算、雲服務平台、智能路網新基建等,以及高精度地圖、操作系統、AI算法與軟件等,涉及感知層、決策層、規控層等。

從玩家角色看,需要汽車制造商、零部件供應商、車載計算平台開發商、自動駕駛解決方案提供商、出行服務供應商等多方市場主體參與。

鄧志東告訴36氪,國内市場主體目前在自動駕駛的各個細分賽道均有全方位的布局。對于新入局者,除非真有一些 “殺手锏” 的東西,要不很難脫穎而出,去分得一杯羹。未來的機會更多還是在産業鍊上遊的關鍵零部件或下遊的模式創新上,這也是價值鍊的高地。

在專精特新的背景下,科學家創業或成果轉化也成為常态。鄧志東談到,對于從事前沿技術突破的科學家,他的後面非常需要一個高效的工程師團隊來支撐,也需要企業家來主導成果的二次開發與市場化運作,而這些成果轉化要素的整合都需要資本的介入。

尤其自動駕駛領域屬于大系統工程,其中不能有任何短闆,一個好的源頭創新思想必須經過各種各樣的試錯實驗、技術驗證和持續的性能疊代。

成立于1999年的 Mobileye 是典型的科學家創業企業,創始人Amnon Shashua 原是以色列希伯來大學的計算機科學教授,創業8年,2007年才推出第一款輔助駕駛産品。2017年被英特爾收購,如今估值已達500億美元。1992年成立的Boston Dynamics (波士頓動力) 也來自于科學家創業,創始人及CEO Marc Raibert曾任CMU與MIT副教授,都屬于那種令投資人既愛又怕的創業者。

鄧志東談到,無論是Mobileye ,還是像波士頓動力這類成立30年仍未盈利的前沿技術公司,中國現實條件下很難存在此類模式的科學家創業企業,原因之一在于從上到下的資本都很難去支持如此長線的投資。

不過,投資人對于高精尖項目的選擇性投資,反而更需要科學家對技術底層邏輯與演進的科學視野及判決。

高校是源頭創新,源頭科技成果并非可以直接轉化成商用産品,這是過去存在的嚴重誤區。

鄧志東告訴36氪,高校的科技成果轉化應主要依靠推動與發展發達的資本來融合主導。一般而言,中間包含二次轉化,三次轉化,市場反饋疊代等,投入其實是非常大的,對此要有清醒的認知。同時,在官産學研用金的大背景下,科學家要去解決真問題,才能夠在成果既要落地,學術研究又需要很前沿之間尋求平衡。

04 談未來:技術成熟後可快速降維應用

鄧志東表示,自動駕駛未來突破點在于可解釋的AI模型與商業模式的創新。

他談到,目前産業内基本形成以美國為代表的“單車智能”路線和以中國為代表的“單車智能 車路協同”路線。國内的優勢在于可以先做政策試點,通過以點帶面,小步快跑,在多樣化應用場景下形成獨特優勢。

政策層面上,截至2021年11月,全國已有38個省/市出台了路測管理細則,先後建設了70個測試示範區,開放了5200多公裡測試道路,發放了1000餘張測試牌照。

另外,2022年8月1日,深圳率先實施了《深圳經濟特區智能網聯汽車管理條例》地方法規;8月8日重慶、武漢“雙城”首次啟動了全車無安全員的自動駕駛商業化付費出行服務試點,開始試水全無人、公開道路、商業化收費的規模化RoboTaxi出現服務,使中國的自動駕駛商業化運營走在世界前列。

可見,産業政策積極引導,安全監管穩步推進,市場主體主動參與,産業生态正在不斷完善,合力支撐正在持續發力,鄧志東表示。

在從L2自動輔助駕駛邁向L3 自動駕駛過程中,鄧志東告訴36氪,一對多邊雲接管将成為一個有效的技術演化路徑。按照發展邏輯,安全員從主駕到副座,副座到後座,後座到邊雲接管的演進過程中,未來再經過持續的技術疊代,邊雲安全接管員通過數字孿生平行世界的AI接管預測,逐步實現一對一,一對十,一對一百的接管照看,并最終過渡到 L4 級别的完全無人駕駛。

一對多邊雲接管降低了人力成本,實現了可持續發展的盈利閉環與商業模式,當共享無人駕駛汽車可滿足一個城市的出行服務需求時,機動車絕對數量将會大大減少,目前很多交通難題都會迎刃而解。

未來,随着自動駕駛技術的成熟,其中涉及的大量共性關鍵技術可以拿來降維應用,包括高價值的視覺感知技術,這樣也能很好地解釋為什麼特斯拉會積極轉到人形機器人的研發。

(完)

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关教育资讯推荐

热门教育资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved