2023汽車半導體生態峰會 || 中汽創智張振林:面向量產的智能駕駛感知研發與實踐
以“鏈啟芯程 · 智造未來”為主題的“2023汽車半導體生態峰會暨全球汽車電子博覽會”,由廣東省工業和信息化廳、深圳市工業和信息化局、中國能源汽車傳播集團指導,《中國汽車報》社主辦,愛集微承辦,于2023年9月26日至27日在深圳福田會議中心隆重召開。
本屆峰會堅持行業領袖峰會的高端定位,全面助力產業間深度融合與創新,推動上下游產業鏈伙伴攜手合作,共同構建具有全球競爭力的汽車科技創新新生態。
峰會現場,多領域、多視角開展的20場特色活動,囊括主峰會、技術研討、項目路演、專業展覽、交流盛宴等,匯聚政、產、學、研、用、投等多個產業圈層,圍繞全球及中國汽車半導體產業熱點展開交流,峰會重點聚焦新技術、新趨勢,深入剖析汽車半導體各細分領域的發展機遇和挑戰,近百個精彩紛呈的演講,共同呈現出一幅專業而全面的思維圖景。
其中,在9月26日舉辦的“感知專場”,中汽創智科技有限公司智能駕駛首席技術官張振林做了題為《面向量產的智能駕駛感知研發與實踐》的精彩演講。以下內容為現場演講實錄:
張振林:非常高興有這樣的機會來跟大家分享一下中汽創智在自動駕駛特別是感知領域所做的一些思考和嘗試。
中汽創智科技有限公司智能駕駛首席技術官 張振林
首先跟大家簡單分享一下從我們的視角看,自動駕駛行業所面臨的趨勢和挑戰。
就像剛剛主持人提到,自動駕駛比作人類的司機,感知就相當于人類的五官,特別是現在在車端的搭載方面,一些核心的傳感器,包括激光雷達、攝像頭、毫米波雷達,性能不斷提升、成本不斷下降,而且車規化的搭載也越來越多。
自動駕駛從ADAS到L2級輔助駕駛,目前的市場占有率或者說搭載率已經上升到30%甚至更多。我們認為自動駕駛已經進入到全場景量產落地的時期,但是在全場景落地的過程中,從安全到成本、工程化、商業模式都充滿了未知數。
隨著自動駕駛的車端搭載量產落地,目前已經基本形成了以特斯拉為代表的以視覺為主、多傳感器融合的方式。特別是現在視覺與多傳感器融合的BEV(Bird's Eye View,鳥瞰視角)感知端到端的大模型成為技術落地的一個大的趨勢和方向。
BEV的落地,背后涉及到大量的數據,包括測試里程。特斯拉提到要超越人類的智能駕駛能力,至少需要百億公里駕駛數據。自動駕駛落地面臨著眾多的挑戰,任何數據的采集和獲取都面臨很多的困難,包括范圍受限、樣本不足,成本高昂。因為數據匱乏,導致算法的泛化性非常差,開發的進展過程非常緩慢。同時目前仿真數據,特別是合成類數據的使用量還是不足的。
回到自動駕駛這一塊,感知系統作為我們的眼睛和五官,要研究的關鍵問題是什么?
我們列舉了感知系統要攻克的五大關鍵技術:一是模型泛化能力;二是模型能力;三是模型的計算效率,特別是對于CPU和GPU的計算效率;四是自動化標注,在自動駕駛感知算法開發過程中,為了準備神經網絡所需要的大量數據,需要用自動化的標注來替代人類的標注,節省時間和成本;五是數據靈活性,使用仿真類數據和生成類數據提供更多場景的數據。
當然我們在這一塊還是有信心的,特別是在全球自動駕駛感知技術處于快速的發展時期,中國在感知技術領域的專利數占據了全球的半壁江山,這也給了我們很大的信心。
感知技術除了剛才講的五大方向,它的核心無非是要解決包括目標的檢測和追蹤、對道路的語義分割、對目標深度的估計、對行為位置的估計,以及現在正在用BEV做的實時地圖的生成,這是我們現在重點研究的技術和方向。
大家知道在10年前一輛自動駕駛車要實現完全自動的駕駛是沒有問題的,但之所以到今天我們還在討論安全員要不要去掉,在某些地方還在進行無安全員的示范運營和嘗試,其實背后就是要解決一些極端場景的問題,特別是中國的道路交通中非常有特色的行人亂穿、加塞、道路施工等場景。
要想解決這些場景,背后需要大量的高質量的標注數據,以及超高的算力提供支撐。但是在數據和算力背后,它的成本是誰都沒有辦法面對的問題。當然前面講了數據,我這邊也提一下算力,去年年底我們買了一批A800的服務器,當時的價格是80萬一臺,到今年一臺A800的訓練服務器的價格已經漲到120萬-150萬,所以這里面的成本是非常高的。
中汽創智怎么來解決這個問題?很多人可能對中汽創智不是很了解,我們其實也是一家比較新的公司,我們是2020年在國資委指導下,由中國一汽、東風公司、兵裝集團、長安汽車和南京江寧經開科技,共同投資160億成立的一家汽車科技公司,我們聚焦在智能底盤、新能動力、智能網聯三大領域,目前主要為我們的股東方提供賦能,同時也在開展相應的合作。
結合中汽創智獨特的定位,我們也一直在思考怎么提高自動駕駛的算法性能,同時降低相關的成本。在之前我們的三家股東方,包括一汽、東風、長安,他們都有自動駕駛的研發團隊,現在任何一家整車廠和任何一家自動駕駛公司都是這么做的,面臨的問題是數據樣本十分受限、算力成本非常高昂、模型泛化的能力不足。
我們最近正在建設“基于數據聯盟的AI基礎服務平臺”。通過共采、共標、共享交易和提供基礎模型的方式,結合大數據、大模型來打造AI技術服務平臺,打通數據壁壘,把算力進行整合。最終實現大模型的開發,為股東方提供基礎模型。
我們從基礎服務的云存儲、計算以及各家的數據,都是由他們各家自己做開發,相關的數據和算力,我們會統一同時接入到我們在做的AI技術服務平臺上。在這個平臺上,我們對所有的數據進行合規化的處理,從數據的采集、預處理到合規化,再到標注、場景挖掘,整個過程通過合規的方式來進行。同時,在整個數據里面,數據的所有權仍然屬于每一家聯盟方,由我們在合規的情況下推動數據的交易和共享。在此基礎上,我們來開發大模型,特別是現在以BEV為核心的端到端的大模型,同時還有預訓練大模型、場景挖掘大模型,最終賦能合作伙伴、聯盟方,進行算法的開發。
(見PPT)這個數據閉環的流程大家已經非常熟悉了,我們現在通過“基于數據聯盟的AI基礎服務平臺”統一采集標注,用預處理工具、標注工具,推動數據交易。采集的時間和資金的用量會大幅度縮短,合規性滿足國家對自動駕駛在整個過程中的要求,極大縮短開發周期,同時節省資金。
中汽創智雖然是很年輕的公司,但是我們也做了很多的工作,具備了很強的能力。首先我們具備了甲級互聯網地圖服務測繪資質,還有合規工具、數據閉環工具、交易工具,我們也拿到了央企數字化轉型典型場景的證書,我們正在跟國資委進行相應的央企數據要素確權保護課題的研究合作。
接下來分享一下中汽創智目前的一些進展。
剛剛我花了很多時間在講數據來源,數據拿過來之后我們怎么用?首先是基于數據驅動,我們自研了一個跨平臺解耦式感知和融合技術,支撐L2到L4的感知需求,包括前視、BEV周視、環視、激光雷達檢測、路端檢測。這套感知算法也是為了解決卡脖子的問題,我們實現了多個平臺的兼容,包括華為的MDC、黑芝麻A1000,地平線J5、Orin和其它的自主芯片平臺。在整個過程中,我們的跨平臺,包括檢測的類別非常豐富,資源的占用率很低,特別適用現在一些低算力的平臺,算法的性能相對來說也是比較優秀的。
我們目前正在從傳統感知,包括二維圖像感知、二維單幀圖像感知到人工編制,往下一代感知進行研發和躍進,這里面包括視頻流感知、多相機BEV感知、融合相機和激光雷達的前融合、多模態感知等等。在背后的數據上,我們有多傳感器視頻數據、長尾數據挖掘系統,同時在這些數據的處理和標注方面,我們引入了預標注大模型,用自動化融合標注取代人工標注。
這里給大家看看我們目前做的一些效果。我們這套感知算法實現了軟硬解耦,包括前視目標檢測,我們支持檢測150米的范圍內的行人、騎行車、交通燈、標牌等。周視方面我們支持2D、單目3D和BEV三種方案,也是為了適應不同的算力和芯片的限制。環視方面主要是用于自動泊車的場景。點云這一塊,包括我們的目標檢測、可行駛區域、靜態車道線的識別功能。
我們也開發了一套基于BEV架構的新一代感知,在一階段的時候我們在BEV的空間里對圖像的特征和提取的點云特征進行視角轉變,對BEV的特征做時序融合。二階段再對它進行特征提取,直接輸出BEV感知所需要的特征要素。這一套算法我們不僅僅是基于傳統的道路上的交通參與者的動態目標,同時也在以目前的重感知、輕地圖的方式進行道路的靜態要素的感知。
(見PPT)給大家看看我們目前在不同的場景下,包括高速、城區的融合感知,包括在城區BEV矢量地圖的感知。
既然要做多傳感器的融合,感知的背后有一套非常精準的時空同步,包括多傳感器標定的方案,就是支撐它落地的基礎,目前我們做到了像素級的匹配和精度。
剛剛提到重感知、輕地圖研發的策略,也是為了解決目前國家對我們自動駕駛開發過程中安全合規的問題,以及高精度地圖的準確度,以及使用中較高的依賴問題,特別是限速、匝道、道路施工、范圍受限等,還是結合BEV這套算法來解決對于高精度地圖的依賴。
我們開發的這套大模型,利用大小兩個模型對同一圖像的推理差異,篩選有標注價值的圖像,這也是提高模型性能、節約成本的一個非常重要的手段。在BEV的背后需要有很好的標注手段,目前我們在逐步取代純人工的通過2D、3D聯合標注的方式,采用自動化的方式來進行標注,目前我們的自動化標注項目對效率的提升已經達到了50%,我們的目標是明年它的效率提高能達到75%。
結合我們這些感知,我們推出了兩個產品,一個是領航Lite,一個是領航Pro,分別針對100Tops的算力和100-250Tops的算力,在城區全場景的行泊一體解決方案。
這是我們目前的自動駕駛的視頻,從城區、上匝道到在高速上行駛,在紅旗汽車上實現了全程無人工干預的自動駕駛。
目前這套算法也是結合我們現在的準視覺方案,在相對復雜的城區和高速上進行自動駕駛。
剛剛提到的這些我們所面臨的機會和挑戰、我們現在在做的工作,我們面向行業發出呼吁,讓我們共同推進自動駕駛包括從數據的合規、數據的共享和交易,共同推動中國自動駕駛落地場景加速實現。