36氪獨家｜理想智能駕駛圍繞「端到端」變陣，加速AI大模型上車 - 科技

2024-07-17科技

文丨李安琪

編輯丨李勤楊軒

在智能駕駛行業，「端到端」正引領著一場技術變革。這最先由特斯拉引起，國內華為、蔚小理等玩家紛紛跟進。技術之外，組織變動也接踵而至。

36氪汽車獨家獲悉，理想汽車近期成立了「端到端自動駕駛」的實體組織，整體200人出頭；同時公司其他團隊一些成員也在靈活支援專案。

理想不是唯一這樣做的企業。此前蔚來汽車已經率先做出組織變革，成立了專門負責端到端的大模型部門。

理想智能駕駛團隊主要分為演算法研發、量產研發兩個大組，團隊約800人。「端到端」的研發主力部署在演算法研發組，由理想智能駕駛技術研發負責人賈鵬負責。

具體來看，演算法研發下設感知演算法、行為智能、認知智能等組。「感知演算法」由常黎主導；「行為智能」包含端到端架構、端到端模型、控制模型等，由楊毅負責；「認知智能」包含認知模型、雲端模型等，實際由詹錕負責。

如果要打個比方，端到端三個主力小組的職責，分別對應智駕系統的感知能力、行走能力，和認知世界的能力。這基本與理想的端到端方案模組呼應。

前不久，理想公開了其端到端自動駕駛技術方案，其方案分為端到端模型、VLM（即Vision-Language Model，視覺語言模型）視覺語言模型、世界模型三部份。

此外，與演算法研發組平行，量產研發組由量產負責人王佳佳負責，包含智能行車、智能泊車、智能安全等。賈鵬與王佳佳均向理想智能駕駛負責人郎鹹朋匯報。

針對上述資訊，36氪汽車向理想汽車求證，截至發稿，未獲回應。

CEO李想公開表示，到今年底或明年初，理想就會推出端到端+VLM的自動駕駛方案，方案將由超1000萬clips（影片片段）訓練而成。理想還打算將參數達22億的視覺語言大模型搬上車。

組織架構的實體化，也將從人力排程方面加速理想「端到端」計劃的落地。

理想智駕，曲折自研

所謂端到端，就是把傳感器數據作為輸入，車輛控制指令作為輸出，中間環節過程都靠AI神經網絡模型來完成。這已經成為智能駕駛行業下一代共識方案。

但「端到端」方案的起勢並不容易。據特斯拉計算，完成一個端到端自動駕駛的訓練至少需要100萬個、分布多樣、高質素的 clips （影片片段）才能正常工作。

馬斯克曾強調過數據在自動駕駛方面的重要性：「用100萬個影片case訓練，勉強夠用；200萬個，稍好一些；300萬個，就會感到Wow（驚嘆）；到了1000萬個，就變得難以置信了。」

對於剛剛轉入端到端方案的車企而言，需要耗費一段時間才能看到成果。

然而當下國內的智駕行業競爭激烈，疊加特斯拉FSD（即Full-Self Driving，指特斯拉全自動駕駛軟件包）入華、華為智駕的「鯰魚效應」，小鵬、蔚來等玩家都在積極追擊。

理想一直都扮演著智駕追趕者的角色。為了高效追趕，理想內部份成了兩隊人馬。

一是在智駕系統AD Max上選擇自研，搭載輝達Orin芯片與激光雷達，提供城市領航輔助駕駛功能（具備城市道路點到點輔助駕駛能力）；

二是在智駕系統AD Pro上與供應商合作，搭載地平線征程5芯片，無激光雷達，能提供記憶行車、城市LCC（車道居中輔助）等功能。

此前據36氪汽車報道，智駕AD Pro方案啟用了智能駕駛供應商輕舟智航。輕舟有300多人，從去年末開始幾乎全員駐場在理想的順義總部。隨著近日AD Pro版本車型功能升級，開發任務告一段落，輕舟主要人力已經撤出理想專案。

而在自研方案上，理想的城市領航輔助功能追趕幾乎從2023年才開始。一年半多時間裏，理想數次切換了智駕的技術路線。

2023年4月，理想喊出了城市NOA落地100城的目標，但「主要是為了應對華為和小鵬的智能駕駛沖擊，口號先行」。近半年後，理想主動將「城市NOA100城」改成了「通勤NOA100城」（通勤NOA指在使用者高頻路段開啟點到點輔助駕駛），因為前者「難度太大」。

然而「通勤NOA」的路同樣不好走，有理想智能駕駛人士向36氪汽車解釋，通勤方案的本質是預先建圖，仍然依賴高精地圖，不符合行業技術趨勢。實際落地擴張效果也不好，「原定目標是一天開拓1條路線，但實際上三個月只構建了2-3條路線，效率很低」。

意識到不對，理想在去年轉而全力追擊「無圖NOA」（指不依賴高精地圖的城區點到點輔助駕駛）功能。

不過由於理想純電車型MEGA失利，理想整體放棄80萬輛的銷量目標後，公司進入裁員節奏，智能駕駛團隊也被波及。目前理想智能駕駛團隊人數約800人，與年初的1300人相比已經大幅裁減。

而理想無圖智駕方案的推播，也從原本的4月推遲到了7月。直到近日理想才向AD Max使用者推播了無圖NOA功能，號稱全國範圍內、可導航的城市道路都可使用功能。

在端到端的效果可檢驗之前，當下推播的功能版本，是理想智能駕駛占領市場、獲得使用者口碑的關鍵。

端到端是一場資源戰

在端到端方案的實踐中，先行者特斯拉FSD v12版本在北美地區已經取得了令人驚艷的效果。

而國內的玩家也從特斯拉的驗證中，找到了通關秘籍：在積累海量的駕駛行為數據、更大雲端算力的訓練下，端到端方案會更加擬人。

今年4月，馬斯克表示，對輝達p00 AI芯片的采購量將從3.5萬增加到8.5萬，並計劃投資100億美元用於汽車的聯合訓練和推理人工智能。此外，特斯拉自研的訓練芯片Dojo近期也開始在台積電投入量產。

同樣，理想在走上端到端方案之後，也在籌謀更大訓練算力。有內部人士告訴36氪，理想認為智能駕駛的下一個競爭點，一定是超算中心。

有知情人士告訴36氪，去年秋季雁棲湖會議上，美團CEO王興、Y Combinator中國創始人陸奇都勸李想，在雲端訓練GPU領域加大投入。

據36氪汽車了解，除了去年向火山引擎購買的300多台輝達伺服器外，目前理想還跟阿裏雲、百度雲等雲廠商都有合作。「現在在高價收購輝達的卡。」

同行也預判到了超算的重要性。從雲端算力來看，目前華為是國內智能駕駛訓練算力最大的玩家。華為表示，6月其智能駕駛訓練算力將達3.5EFLOPS。小鵬、蔚來智駕中心算力分別是0.6EFLOPS、1.4 EFLOPS，而據36氪了解，理想的智算中心算力為2.4 EFLOPS。甚至老牌車企長城也在加入戰局，超算中心算力為1.64EFLOPS。

端到端之戰，不僅是車企智能駕駛技術路線的一次變更，更考驗著車企們長期的兵馬糧草供給。這將是一場耐力比拼。