當前位置:法律諮詢服務網 - 企業資訊 - 如何在智能計算中心建立自動駕駛的大規模模型和新的基礎設施?

如何在智能計算中心建立自動駕駛的大規模模型和新的基礎設施?

2023年初,先是新年末智行控股HAOMOAIDAY,發布了自動駕駛行業最大的智能計算中心。緊接著,理想春運的小鵬和所有員工都相信了城市導航輔助駕駛,緊接著,對話式AI的大模型ChatGPT傳遍了全網,自動駕駛AI技術再次成為了中流砥柱。

無論是自動駕駛的“進城”,還是ChatGPT的“進化”,背後都是對數據和計算能力需求的指數級增長,以及大模型的訓練。需求上來,智能計算中心作為自動駕駛的“新基礎設施”,越來越被業界提及。

智能計算中心(Intelligent computing center),即智能計算中心,是基於人工智能理論,采用領先的AI計算架構,提供人工智能應用所需的計算服務、數據服務和算法服務的新型計算基礎設施。換句話說,智能計算中心實際上是壹個計算電源和生產平臺。那為什麽“自動輔助駕駛”可以用它變成“自動駕駛”呢?

“投降”自動駕駛邊際成本自動駕駛智能計算中心“專用於雲端”

有人說智能計算中心是自動駕駛發展的助推器,因為自動駕駛算法模型的訓練是機器學習的典型場景之壹,其視覺檢測、軌跡預測、駕駛規劃等算法模型需要同時完成高並發的並行計算,對計算能力的需求很高,而智能計算為提高算法模型的成熟度提供了巨大的計算能力。

在自動駕駛領域,提到智能計算中心,必須首先提到特斯拉。2017,變壓器網絡出現後,奠定了大模型領域主流算法架構的基礎。然後在2020年,特斯拉將變壓器模型引入自動駕駛領域,這是AI模型應用於自動駕駛的開始。之後,特斯拉開始打造自己的AI計算中心——Dojo,總共使用了1.4萬個英偉達GPU來訓練AI模型。為了進壹步提高效率,特斯拉在2021發布了自主研發的AI加速芯片D1,並計劃將25個d 1封裝在壹起,形成壹個訓練瓦片,然後形成壹個Dojo ExaPOD。在最新壹期的特斯拉AI DAY中,馬斯克表示,特斯拉超級計算機組ExaPOD將於2023年第壹季度部署。

國內方面,2022年8月,Xpeng Motors與阿裏雲聯合建立了當時國內最大的自動駕駛智能計算中心,專門用於自動駕駛模型訓練,計算能力達到600PFLOPS,相當於每秒完成60億次浮點運算。然而,這個記錄只維持了四個多月。

5438年6月+今年10月,米莉智行與火山引擎聯合推出了自動駕駛行業最大的智能計算中心MANA OASIS(雪湖綠洲),每秒67億次浮點運算,每秒2T存儲帶寬,每秒800G通信帶寬。吉利還在65438年6月28日推出了吉利之星智能計算中心。目前已接入智能駕駛和車聯網實驗數據近100 PB,在線車輛並發計算支持達到百萬。

從現有情況來看,成本和需求兩個因素是智能計算中心的吸引力所在。

在成本層面,計算能力作為自動駕駛的基礎要素,需要更高性能的智能計算中心來完成訓練、標註等工作。以MANA OASIS為例,通過部署Lego高性能算子庫、ByteCCL通信優化能力和大模型訓練框架,將計算能力優化到極致。在訓練效率上,基於稀疏MoE,通過跨機* * *共享,輕松完成數千億參數的大模型訓練,百萬剪輯(毫米級視頻最小標記單位)訓練成本僅100卡周,降低訓練成本100倍。

構建高效低成本的數據智能系統是自動駕駛技術健康發展的基礎,是自動駕駛系統不斷叠代進步的重要環節,也是自動駕駛閉環商業化的關鍵。

Xpeng Motors董事長何曾表示,“如果不通過這種方式(智能計算中心)提前儲備計算能力,那麽未來五年,企業的計算能力成本將從幾億增加到幾十億。”

如果繼續使用公有雲服務,邊際成本上升只是壹個方面。更重要的是,智能計算中心可以讓自動駕駛企業實現“專用雲”。自動駕駛的開發包括數據采集、數據篩選、標記、模型訓練、回放驗證、模擬測試等。雲計算的本質是租用計算設備,雲服務商的設備都是統壹購買的。為了獲得更多的客戶,這些設備具有很大的通用性。設備內部使用的CPU、GPU/AI加速器、內存的型號和規格都比較固定,很難和車企、自動駕駛公司的算法形成最佳匹配。而且雲服務廠商對自動駕駛算法的理解並不高,必然會導致計算能力調度的損耗和低效問題。所以從需求的角度來看,智能計算中心似乎可以成為自動駕駛和車企的神器。

以米莉為例,在MANA OASIS的加持下,米莉MANA五款車型升級,車側感知架構跨代升級。米莉技術棧的布局繼續保持完整和領先的態勢,尤其在感知和認知方面,領先行業,引領大模型、大計算力、大數據的發展方向,沖刺進入自動駕駛3.0時代。

在數據采集、篩選和標註方面,自動駕駛系統在開發初期需要采集大量的道路環境數據,使車輛能夠像人類駕駛員壹樣快速準確地識別車道、行人、障礙物等行駛環境中的關鍵信息。唯壹的辦法就是在海量數據的基礎上,通過反復訓練和驗證,使車輛對道路環境的認知水平逐漸接近真實場景,在這個過程中不斷提高判斷的準確性。

而且車企收集的數據需要模型訓練,算法通過對數據的操作生成模型,智能計算中心將是驅動大模型和海量數據訓練的加速器。基於稀疏MoE,根據計算特點進行稀疏激活,提高計算效率,實現單機可以訓練數百億參數的大型模型的效果,實現跨機享受exper的方法,完成數千億參數的大型模型的訓練,將訓練成本降低到每周100卡的水平;毫米設計並實現了業界領先的多任務並行訓練系統,可以同時處理圖片、點雲、結構化文本等多模態信息,既保證了模型的稀疏性,又提高了計算效率。法力綠洲訓練效率提升100倍。

Mimo智行CEO顧郝偉也詳細解釋了構建智慧計算中心的底層邏輯:“自動駕駛對智慧計算中心的第壹要求肯定是計算能力。智能計算中心的超級計算能力,代表了這個武術領域能有多少AI工程師做出大模型,能培養出多少大模型。”

智能輔助駕駛MANA OASIS幫助解決了哪些問題?

現在很多車企和自動駕駛技術公司已經開始建設智能計算中心,作為下壹階段的競爭。在今年5438年6月+10月的墨豪AI日,墨豪智行董事長張凱給出了2023年自動駕駛行業趨勢的十大新預測,超算中心位列其中。“超算中心將成為自動駕駛企業的入門配置。”

事實上,目前隨著新能源汽車品牌普遍將高速公路場景下的輔助駕駛列為標配,賽場已經悄然從高速公路轉向城市。與高速導航輔助駕駛相比,城市駕駛涉及紅綠燈、路口、行人電動車、遮擋、固定障礙物、頻繁剎車和啟動等壹系列問題,其復雜性增加了幾個數量級。

如果只用實測的車輛去挑戰這些角落案例,成本、安全、時間都會成為企業發展的壁壘。因此,虛擬仿真成為解決部分成本和場景多樣性的關鍵。其中,大規模長尾場景需要數據中心足夠的計算支持。同時,模擬場景向現實的回歸過程也需要巨大的計算能力來提供支持。

在MANA OASIS的加持下,數據情報系統MANA的五個型號都得到了升級。在五個模型的幫助下,MANA最新的車輛端感知架構從過去分散的多個下遊任務中整合而成,形成了更加端到端的架構,包括壹般障礙物識別、局部道路網絡、行為預測等任務。車輛側感知架構已經跨代升級。這也意味著米莉擁有更強的感知能力和更強的產品力,正在加速向全無人駕駛邁進。

首先是視覺自監測模型,使得米莉在國內率先實現了4D片段的自動標註。毫米通過視頻自監控使用海量視頻片段預訓練大型模型,使用少量人工標註的片段數據進行微調訓練檢測跟蹤模型,使模型具備自動標註能力;然後提取標註單幀數據對應的原始視頻,組織成片段,其中10%為標註幀,90%為未標註幀,然後將這些片段輸入模型,完成90%未標註幀的自動標註,實現所有單幀標註自動轉換為100%的片段標註,同時減少98%。毫米波視頻自監控模型具有出色的泛化效果,即使在壹些非常困難的場景下,如嚴重遮擋的騎車人、遠處的小目標、惡劣的天氣和光照等,也能準確完成自動標註。

其次,大模型的三維重建有助於數據的生成,以較低的成本解決數據分發問題,提高感知效果。面對完全從真實數據中積累拐角案例既困難又昂貴的行業難題,Millicent將NeRF技術應用於自動駕駛場景重建和數據生成。通過改變視角、光照和紋理材質,生成高度逼真的數據,實現正常案例的低成本獲取,並生成各種高成本的拐角案例。大模型三維重建生成的數據不僅優於傳統的人工顯式建模和渲染紋理的方法,而且成本更低。增加NeRF生成的數據後,感知錯誤率可降低30%以上,數據生成全過程自動化,無需任何人工參與。

多模態相互監督大模型可以完成對壹般障礙物的識別。在成功實現對車道線和常見障礙物的精確檢測後,Millie正在思考和探索壹種更通用的解決方案,以穩定檢測城市中的各種異形障礙物。目前毫米的多模態互監模型引入了激光雷達作為視覺監管信號,直接利用視頻數據來推斷場景的大致結構表達。這種通用結構的檢測可以很好地補充現有的語義障礙檢測,有效提高復雜城市工況下自動駕駛系統的通過率。

動態環境的大模型可以準確預測道路的拓撲關系,使車輛始終保持在正確的車道上。在重感知技術的路線下,為了盡量減少對高精度地圖的依賴,米莉面臨著“道路拓撲實時推斷”的挑戰。因此,在BEV的特征地圖基礎上,以標準地圖為指導信息,利用自回歸編解碼網絡,將BEV特征解碼成結構化的拓撲點序列,實現車道拓撲預測。在標準地圖的導航提示下,讓毫毫的感知能力像人類壹樣,可以實現道路拓撲結構的實時推斷。

我覺得解決了路口問題其實就解決了大部分城市的NOH問題。目前在保定和北京,85%的路口拓撲推斷準確率高達95%。哪怕是非常復雜不規則的路口也能準確預測,而且比老司機年紀大。

人類駕駛的自我監控認知模型已於今年2月正式升級為DriveGPT,這也是全球首個自動駕駛認知模型。可以使駕駛策略更加擬人化、安全、流暢。目前,毫米波DriveGPT已經完成了模型搭建和第壹階段數據運行,參數尺度可以達到GPT-2的標準。接下來,DriveGPT將繼續引入大規模真實接管數據,通過人類駕駛數據反饋的強化學習,不斷提升評估效果。同時,DriveGPT也將作為雲端評測模型,在車輛端對小車型的駕駛效果進行評測。

仿真試驗可以有效縮短技術和產品的開發周期,降低研發成本。業內典型的長尾場景不夠豐富,利用仿真平臺可以方便地生成現實中可遇而不可求的極端場景。由於仿真測試中的仿真環境需要實現多模態融合來支持傳感器模塊的復雜性,因此也需要大計算能力的支持。

除了細節,特斯拉超級計算中心擁有近2萬個GPU,對自動駕駛訓練的效率有立竿見影的效果,最大化自動駕駛系統的開發效率;大陸集團的高計算能力集群將開發周期從幾周縮短到幾個小時,使自動駕駛能夠在中短期商業計劃中實施;機器學習時間的縮短加快了新技術進入市場的速度;小鵬自駕核心車型訓練時間由7天縮短至1小時,速度大幅提升近1.70倍...

目前,在自動駕駛領域有長遠規劃的車企,無論是造車新勢力、傳統品牌還是技術供應商,都在建設自己的超級計算中心,掌握穩定的計算資源,縮短開發周期,加快自動駕駛產品上市速度,這是不爭的事實。相反,如果沒有超算中心,自動駕駛訓練的速度會明顯變慢,自動駕駛企業之間的差距會越來越明顯。

用智能計算中心構建數據護城河數字新基礎設施逐漸成為發展標準。

自自動駕駛發展至今,業界發現客車智能輔助駕駛是最有可能大規模鋪開的商業場景。高級工程智能汽車研究院數據顯示,2022年中國市場(不含進出口)乘用車L2級輔助駕駛標配搭載率已連續第二個月超過30%。根據智研咨詢的數據,預計到2025年,全球新車L2自動駕駛滲透率將達到53.99%。

今年,城市導航輔助駕駛也開啟了量產之旅。西部證券預測,2023-2025年,國內市場將有70萬輛、1.69萬輛、348萬輛汽車配備城市導航輔助駕駛,占比分別為17%、40%、70%。

在城市導航輔助駕駛加速的背景下,更容易復制和擴展的重感知方案受到了更多的關註。面對重感知技術路線下“道路拓撲結構實時推斷”的挑戰,選擇是在特征地圖的基礎上,以標準地圖為指導信息,采用自回歸編解碼網絡,通過結構化拓撲點序列解碼,實現車道拓撲預測。不難看出,業界已經逐漸達成* * *知識的再感知路線,比高精地圖解決方案更依賴計算能力。

人工智能是創新的加速器,智能計算中心可以為各類技術創新提供支撐。智能計算中心壹方面可以為構建安全、可信、可復用的技術研發環境提供計算設施,為各領域的科研開發提供智能計算服務,加快科研開發進程;另壹方面,智能計算中心是新壹代信息技術的綜合應用載體。智能計算中心的快速建設、推廣和大規模應用,將推動通信服務網絡、大數據、人工智能等技術的快速叠代,從而推動技術創新。自動駕駛數據是碎片化的,特點是很多小文件,達到幾百億,訓練中有很多數據要交換。智能計算中心可以提供足夠的帶寬,它可以使自動駕駛模型有壹個更好的並行計算框架,在訓練時充分利用硬件資源。

2020年4月20日,國家發改委首次明確了新型基礎設施的範圍,包括以智能計算中心為代表的計算基礎設施。2023年6月65438+10月10,國家工業信息安全發展研究中心發布《智能計算中心2.0未來報告》指出,經過5年多的發展,智能計算中心正從1.0的粗放擴張階段走向2.0的精細規劃階段。

據相關統計和測算,目前中國有30多個城市正在建設或準備建設智能計算中心,未來五年中國智能計算能力的年復合增長率將達到52.3%。智能計算中心的創新發展將進壹步夯實人工智能的“計算基礎”,成為驅動人工智能及相關產業快速發展的新引擎。

“我們估計智能計算中心帶來的成本優化是驚人的,將達到億元級別。”這是張凱在今年65438+10月份做的預測。從目前和未來規劃的量產規模來看,自建智能計算中心可以節省巨額成本;同時,它的效率提升也非常明顯。

隨著人工智能的快速發展和新算法的出現,需要盡快引入新的技術和模型。同時,數據是智能化發展的最大驅動力,也占據了大量的成本成分。利用自建的智能計算中心構建數據護城河,不僅可以完善產業智能生態,還可以讓企業在智能上擁有先發優勢。智能計算中心作為壹種新型的數字化基礎設施,必然引領未來自動駕駛技術的不斷叠代升級。

本文來自易車好作者的汽車行業視野,版權歸作者所有。請以任何形式聯系作者。內容僅代表作者觀點,與車改無關。

  • 上一篇:大多數農村人不使用自來水。是因為家裏的自來水不幹凈嗎?
  • 下一篇:如何查找金蝶bom查詢的物料範圍
  • copyright 2024法律諮詢服務網