當前位置: 華文世界 > 科技

Waymo工程高管:Waymo擁有車載與雲端雙AI模型

2024-10-21科技

Waymo車載技術工程主管斯裏坎特·提魯瑪

Waymo是Alphabet的子公司,始於2009年的Google自動駕駛計畫。近幾年它才開始向公眾提供無人工安全員陪伴的乘車服務。8月,Waymo宣布,它每周在美國營運的幾個城市裏完成超過10萬次的付費乘車。然而,隨著Waymo擴充套件到新的城市,它需要讓成千上萬的新乘客克服坐在無人駕駛出租車裏的不安感。

雖然Waymo過去對其AI驅動的自動駕駛技術運作方式有所保留,但如今公司認為,公開更多「幕後」的資訊對於自動駕駛汽車的廣泛接受非常重要。Waymo車載技術工程主管斯裏坎特·提魯瑪萊(Srikanth Thirumalai)在接受【財富】采訪時表示,在傳達資訊時優先考慮安全性(而非專註於AI),對建立乘客的信任至關重要。

「我們不想讓人們偏離我們的初衷,」提魯瑪萊在首次接受采訪時告訴【財富】。他在亞馬遜工作了18年後,於一年前加入Waymo。「我們必須以‘嘿,我們正在負責任地開發這項技術’為首要資訊。」

他還解釋說,幫助更多人了解其AI驅動系統的工作原理,是公司15年努力構建「全球最值得信賴的司機」的下一階段。「分享更多關於我們技術和安全性的資訊對於建立乘客和營運社群的信任至關重要,」他說。

超越生成式AI的熱潮

雖然目前Waymo暫時領先於自動駕駛領域的競爭對手,但自動駕駛汽車仍在持續開發中。從通用汽車、亞馬遜、特斯拉到像Wayve這樣的軟體開發公司,所有這些公司都在投入數十億美元開發自己的系統。而監管機構也在密切關註這些在特定區域內行駛的機器人汽車。

今年2月,通用汽車的Cruise機器人出租車在舊金山發生一起事故,撞到了一位被另一輛車撞飛到它前方的行人,導致該行人被拖行了20英尺。之後,加州機動車管理局吊銷了Cruise的授權證。公司在全美範圍內暫停了車隊的執行,最近才在一些城市恢復了有安全員陪伴的測試。

Waymo目前尚未發生嚴重事故,但也有不少新聞報道。5月,一輛空載的Waymo出租車在亞利桑那州鳳凰城撞上了一根電線桿,Waymo隨後自願召回並更新了其672輛自動駕駛車輛的全部軟體。8月,有報道稱,幾輛Waymo汽車在舊金山的一處停車場互相按喇叭,擾亂了附近的居民(Waymo解釋說,這是一項防止低速碰撞的安全功能的「意外後果」)。上周,一輛Waymo汽車在舊金山的公交車旁停下,導致視訊中幾位技術公司CEO試圖移動它。Waymo代表稱,「公交車的後門碰到了我們車輛的一側,導致無法關閉。我們派出路邊援助團隊去取回車輛,但在他們到達前,旁觀者搖晃了我們的車輛,使公交車能夠繼續行駛。」

提魯瑪萊此前在亞馬遜專註於AI驅動的搜尋和購物技術,他強調了在現實世界中開發安全可靠的產品這一挑戰讓他感到興奮,這也是他加入Waymo的原因之一。同時,他補充說,自動駕駛汽車是擺脫生成式AI當前熱潮的一種方式。

自動駕駛汽車提出了一個極端的「長尾」學習問題——那些罕見且不可預見的事件雖然發生率低,但在數量上卻是眾多的,且必須優先解決。這些車輛需要一種能夠很好地「泛化」的AI,既能處理相對常見和可預測的情況,比如紅燈停車或讓行給行人,也能應對一些令人意外的場景,如輪椅上的人在夜間過馬路,或者一棵倒下的樹擋住了路,甚至是一群從卡車上逃跑的馬戲團動物。

Waymo的雙AI模型——車載與雲端

為了應對可預測和「長尾」的駕駛情況,Waymo的技術堆疊包括車載的數十個傳感器,這些傳感器讓車輛能夠視覺化其周圍環境,並為AI系統提供全面的數據支持,幫助其即時做出決策。

這些傳感器包括雷達、高畫質網路攝影機、其他視訊網路攝影機和外部音訊接收器,以及安裝在車頂的LiDAR(光探測和測距)傳感器,能夠生成即時的360度三維檢視並提供深度感知。這些傳感器使Waymo Driver系統的視野重疊,以便它能夠同時從不同的角度觀察多達300公尺之外的物體、障礙物或地形特征(Waymo表示,下一代系統在晴天時的探測範圍可達500公尺)。

傳感器收集的數據來自Waymo每次行程中的不同場景。公司還透過合成數據對Waymo進行訓練,模擬比它可能在鳳凰城或舊金山遇到的情況更廣泛的多樣場景,例如不同的天氣條件。

Waymo開發了一個名為「Waymo基礎模型」的大規模AI模型,它支持車輛感知周圍環境、預測其他道路使用者的行為、模擬場景並做出駕駛決策。這個大型模型的運作方式類似於大語言模型(LLM),比如ChatGPT,後者透過龐大的數據集進行訓練,學習模式並做出預測。正如OpenAI和谷歌等公司構建了能夠結合不同型別數據的新型多模態模型(例如文本與影像、音訊或視訊的結合),Waymo的AI整合了來自多個來源的傳感器數據以理解其環境。

Waymo基礎模型是一個大型模型,但當乘客進入Waymo時,汽車執行的是從更大的模型「提取」出來的較小的車載模型——因為它需要足夠緊湊,以便在車輛的能量供應下執行。大型模型作為「教師」模型將其知識傳授給較小的「學生」模型——這一過程在生成式AI領域中被廣泛使用。較小的模型被最佳化為速度和效率,並在每輛車上即時執行,同時保留了駕駛決策所需的關鍵能力。

因此,感知與行為任務,包括感知物體、預測其他道路使用者的行動和規劃車輛的下一步動作,都是在車載模型上即時完成的。較大的模型還可以模擬真實的駕駛環境,以虛擬測試和驗證其決策,然後再將其部署到Waymo車輛上。車載模型意味著Waymo並不依賴於持續的無線網路連線來執行——如果連線暫時中斷,Waymo不會因此停滯不前。

最終,提魯瑪萊解釋說,Waymo的AI系統能夠根據當時的情況選擇它認為最佳的行駛軌跡。因涉及保密問題,Waymo不會透露有關模型的具體參數或其他細節。

「我看到了未來,不參與簡直太愚蠢了」

Waymo的AI系統並非唯一一種應對自動駕駛的方式。例如,英國初創公司Wayve由微軟和Meta首席科學家Yann LeCun支持,它不使用LiDAR(盡管它使用高畫質網路攝影機),而是依賴於已經在許多車輛中標配的網路攝影機和超音波傳感器,並專註於開發一個單一生成式AI「世界模型」,該模型能夠解釋視覺數據並作為一個整合系統做出駕駛決策。特斯拉的自動駕駛系統(目前尚未具備無監督自動駕駛能力)不使用LiDAR,而依賴於傳感器和一套八個網路攝影機,提供車輛周圍360度的視野。隨著特斯拉推進無監督自動駕駛的目標,它也開始測試基於神經網路的新AI系統。

然而,Wayve目前並沒有像Waymo那樣在路上營運數百輛自動駕駛出租車,而是專註於開發軟體產品,計劃部署在大型汽車制造商生產的車輛中。特斯拉的自動駕駛出租車預計至少還要幾年才能上路。而Waymo的策略是「從我們試圖解決的問題反向工作」,即「如何讓這些車輛真正走向現實世界?」

對於提魯瑪萊來說,幫助Waymo利用AI實作其安全目標的機會是無法拒絕的。他表示:「我在亞馬遜過得很好,並沒有主動尋求改變。但Waymo找上門後,我被這個團隊、他們的使命、他們迄今為止的成就震撼到了——很明顯,在AI的推動下,他們將會成為世界變革的巨大力量。」

雖然我在陡峭的舊金山街道上曾有過緊張時刻,但提魯瑪萊卻沒有這樣的擔憂。他在與Waymo聯合執行長德米泰瑞·多爾戈夫(Dmitri Dolgov)面試期間第一次乘坐Waymo的體驗,徹底讓他大開眼界。

提魯瑪萊描述了他的Waymo體驗:這輛車穿過舊金山的早高峰,駛上了電報山,一直到了俯瞰城市和海灣的科伊特塔。值得說明的是,Waymo的駕駛過程中並沒有任何隱藏的幕後人類操作:「如果我們每個月要行駛數百萬英裏,這樣的做法根本不可能擴充套件。」他說,不過他也強調,如果Waymo汽車遇到卡住的情況並需要額外的上下文資訊,公司確實有遠端操作員可以介入。

當Waymo安全地穿過狹窄的街道,預判行人並應對雙排停車時,提魯瑪萊意識到自己正在經歷一次非常特殊的乘車體驗。他說:「我當時就在想,這些人已經把技術提升到了這種程度,這輛車的駕駛表現和人類一樣好,甚至更好——而且他們是在AI剛剛起飛的時刻實作這一切的。」

提魯瑪萊回到家後,向他的妻子講述了這次體驗。「我說,天哪,我看到了未來,」他回憶道。「如果我不加入其中,那真是太愚蠢了。」