端到端自動駕駛技術不斷前進演化，純視覺、真無圖方案真的來了？

2024-07-17科技

以谷歌設立自動駕駛部門為標誌性事件，自動駕駛汽車已經走過15年的發展歷程。近期，隨著百度旗下「蘿蔔快跑」無人出租車的爆火、特斯拉FSD（全自動駕駛功能）在華落地的臨近，自動駕駛公司紛紛加碼端到端技術，行業有望跨入高速發展的新階段。

7月16日，Nullmax正式推出新一代自動駕駛技術Nullmax Intelligence（簡稱「NI」）。新技術由一個多模態的端到端大模型，加上一個安全類腦組成，著重於打造全場景的自動駕駛套用，是一套純視覺、真無圖的自動駕駛解決方案。

近年來，汽車智慧化程度快速提升，智駕套用場景逐步擴大，高階功能向城市加速滲透。但是由於重規則、泛化差、成本高、開不好等問題，智慧駕駛的普及受到限制。但隨著AI大模型技術的引進和發展，基於純視覺方案的端到端自動駕駛技術因為能很好地解決上述痛點，成為了這場汽車智慧化變革的主浪潮。

但如果僅僅是端到端技術，即便是加上多傳感器如雷射、公釐波等，也很難實作非常智慧化的自動駕駛，Nullmax創始人兼CEO徐雷在接受第一財經記者采訪時表示，這其中一定要包含多模態能力的大模型。

因為完全基於視覺的端到端自動駕駛技術不具備傳統自動駕駛系統的「透明性」，傳統自動駕駛是模組化方法，端到端自動駕駛是一體化方法，不產生中間結果，只要輸入原始數據就可以輸出最終結果，存在黑盒、解釋性差的問題。

為了解決上述難題，徐雷表示，NI在視覺基礎上，增加了對聲音、文本、手勢等資訊的輸入支持，透過多模態的端到端模型進行任務的推理，並構建了基於類腦神經網路的安全類腦，由系統整體輸出視覺化結果、場景描述和駕駛行為。這種架構設計，使得NI可以像人類一樣，根據接收的影像、聲音、文字等各種資訊進行思考，同時也具有「趨利避害」的生物本能。

除此之外，NI並不依賴雷射雷達、雙目相機、大算力以及各類地圖，這讓其成本可以控制在小幾千元範圍內，更加適合普及套用。據悉，基於NI，Nullmax計劃2025年實作全場景智駕套用的落地。

火山引擎汽車行業總經理楊立偉也在今年的中國電動汽車百人會上表示：「隨著模型能力的叠代，以及模型從語言模型逐漸變成一個加上生成、加上多模態理解的能力，我相信在今年年底到明年可能會有質變的產生。」

目前，根據國內頭部乘用車自動駕駛企業已經公布的方案，預計端到端自動駕駛將在2024年~2025年密集上車，包括華為、小鵬、元戎啟行、商湯絕影等。在商用車方面，零一汽車也公布了相關規劃，預計在2025年初實作端到端大模型上車，在2027年中實作大規模商業化落地。

(本文來自第一財經)