當前位置: 華文世界 > 科技

36氪獨家|理想智能駕駛圍繞「端到端」變陣,加速AI大模型上車

2024-07-17科技

文丨李安琪

編輯丨李勤 楊軒

在智能駕駛行業,「端到端」正引領著一場技術變革。這最先由特斯拉引起,國內華為、蔚小理等玩家紛紛跟進。技術之外,組織變動也接踵而至。

36氪汽車獨家獲悉,理想汽車近期成立了「端到端自動駕駛」的實體組織,整體200人出頭;同時公司其他團隊一些成員也在靈活支援專案。

理想不是唯一這樣做的企業。此前蔚來汽車已經率先做出組織變革,成立了專門負責端到端的大模型部門。

理想智能駕駛團隊主要分為演算法研發、量產研發兩個大組,團隊約800人。「端到端」的研發主力部署在演算法研發組,由理想智能駕駛技術研發負責人賈鵬負責。

具體來看,演算法研發下設感知演算法、行為智能、認知智能等組。「感知演算法」由常黎主導;「行為智能」包含端到端架構、端到端模型、控制模型等,由楊毅負責;「認知智能」包含認知模型、雲端模型等,實際由詹錕負責。

如果要打個比方,端到端三個主力小組的職責,分別對應智駕系統的感知能力、行走能力,和認知世界的能力。這基本與理想的端到端方案模組呼應。

前不久,理想公開了其端到端自動駕駛技術方案,其方案分為端到端模型、VLM(即Vision-Language Model,視覺語言模型)視覺語言模型、世界模型三部份。

此外,與演算法研發組平行,量產研發組由量產負責人王佳佳負責,包含智能行車、智能泊車、智能安全等。賈鵬與王佳佳均向理想智能駕駛負責人郎鹹朋匯報。

針對上述資訊,36氪汽車向理想汽車求證,截至發稿,未獲回應。

CEO李想公開表示,到今年底或明年初,理想就會推出端到端+VLM的自動駕駛方案,方案將由超1000萬clips(影片片段)訓練而成。理想還打算將參數達22億的視覺語言大模型搬上車。

組織架構的實體化,也將從人力排程方面加速理想「端到端」計劃的落地。

理想智駕,曲折自研

所謂端到端,就是把傳感器數據作為輸入,車輛控制指令作為輸出,中間環節過程都靠AI神經網絡模型來完成。這已經成為智能駕駛行業下一代共識方案。

但「端到端」方案的起勢並不容易。據特斯拉計算,完成一個端到端自動駕駛的訓練至少需要100萬個、分布多樣、高質素的 clips (影片片段)才能正常工作。

馬斯克曾強調過數據在自動駕駛方面的重要性:「用100萬個影片case訓練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow(驚嘆);到了1000萬個,就變得難以置信了。」

對於剛剛轉入端到端方案的車企而言,需要耗費一段時間才能看到成果。

然而當下國內的智駕行業競爭激烈,疊加特斯拉FSD(即Full-Self Driving,指特斯拉全自動駕駛軟件包)入華、華為智駕的「鯰魚效應」,小鵬、蔚來等玩家都在積極追擊。

理想一直都扮演著智駕追趕者的角色。為了高效追趕,理想內部份成了兩隊人馬。

一是在智駕系統AD Max上選擇自研,搭載輝達Orin芯片與激光雷達,提供城市領航輔助駕駛功能(具備城市道路點到點輔助駕駛能力);

二是在智駕系統AD Pro上與供應商合作,搭載地平線征程5芯片,無激光雷達,能提供記憶行車、城市LCC(車道居中輔助)等功能。

此前據36氪汽車報道,智駕AD Pro方案啟用了智能駕駛供應商輕舟智航。輕舟有300多人,從去年末開始幾乎全員駐場在理想的順義總部。隨著近日AD Pro版本車型功能升級,開發任務告一段落,輕舟主要人力已經撤出理想專案。

而在自研方案上,理想的城市領航輔助功能追趕幾乎從2023年才開始。一年半多時間裏,理想數次切換了智駕的技術路線。

2023年4月,理想喊出了城市NOA落地100城的目標,但「主要是為了應對華為和小鵬的智能駕駛沖擊,口號先行」。近半年後,理想主動將「城市NOA100城」改成了「通勤NOA100城」(通勤NOA指在使用者高頻路段開啟點到點輔助駕駛),因為前者「難度太大」。

然而「通勤NOA」的路同樣不好走,有理想智能駕駛人士向36氪汽車解釋,通勤方案的本質是預先建圖,仍然依賴高精地圖,不符合行業技術趨勢。實際落地擴張效果也不好,「原定目標是一天開拓1條路線,但實際上三個月只構建了2-3條路線,效率很低」。

意識到不對,理想在去年轉而全力追擊「無圖NOA」(指不依賴高精地圖的城區點到點輔助駕駛)功能。

不過由於理想純電車型MEGA失利,理想整體放棄80萬輛的銷量目標後,公司進入裁員節奏,智能駕駛團隊也被波及。目前理想智能駕駛團隊人數約800人,與年初的1300人相比已經大幅裁減。

而理想無圖智駕方案的推播,也從原本的4月推遲到了7月。直到近日理想才向AD Max使用者推播了無圖NOA功能,號稱全國範圍內、可導航的城市道路都可使用功能。

在端到端的效果可檢驗之前,當下推播的功能版本,是理想智能駕駛占領市場、獲得使用者口碑的關鍵。

端到端是一場資源戰

在端到端方案的實踐中,先行者特斯拉FSD v12版本在北美地區已經取得了令人驚艷的效果。

而國內的玩家也從特斯拉的驗證中,找到了通關秘籍:在積累海量的駕駛行為數據、更大雲端算力的訓練下,端到端方案會更加擬人。

今年4月,馬斯克表示,對輝達p00 AI芯片的采購量將從3.5萬增加到8.5萬,並計劃投資100億美元用於汽車的聯合訓練和推理人工智能。此外,特斯拉自研的訓練芯片Dojo近期也開始在台積電投入量產。

同樣,理想在走上端到端方案之後,也在籌謀更大訓練算力。有內部人士告訴36氪,理想認為智能駕駛的下一個競爭點,一定是超算中心。

有知情人士告訴36氪,去年秋季雁棲湖會議上,美團CEO王興、Y Combinator中國創始人陸奇都勸李想,在雲端訓練GPU領域加大投入。

據36氪汽車了解,除了去年向火山引擎購買的300多台輝達伺服器外,目前理想還跟阿裏雲、百度雲等雲廠商都有合作。「現在在高價收購輝達的卡。」

同行也預判到了超算的重要性。從雲端算力來看,目前華為是國內智能駕駛訓練算力最大的玩家。華為表示,6月其智能駕駛訓練算力將達3.5EFLOPS。小鵬、蔚來智駕中心算力分別是0.6EFLOPS、1.4 EFLOPS,而據36氪了解,理想的智算中心算力為2.4 EFLOPS。甚至老牌車企長城也在加入戰局,超算中心算力為1.64EFLOPS。

端到端之戰,不僅是車企智能駕駛技術路線的一次變更,更考驗著車企們長期的兵馬糧草供給。這將是一場耐力比拼。