當前位置: 華文世界 > 科技

終端AI分級標準落地,手機大模型「戰火」燒到了智能體

2024-10-20科技
AI與作業系統的深度融合成為了過去一個月手機廠商對外火力的集中點,從蘋果的「Apple Intelligence」到榮耀的「AI智能體」、再從vivo的「PhoneGPT」到OPPO的「AIOS」,AI Agent智能體的競爭開始成為衡量手機廠商技術能力的關鍵所在。
在AI手機「大亂鬥」的同時,相關的分級討論也在進行。中國資訊通訊研究院(以下簡稱「信通院」)10月18日聯合榮耀、vivo、華為等多家終端以及芯片公司釋出全球首份【終端智能化分級研究報告】,對AI手機的前進演化路徑給出明確方向。
「真假AI」手機至此有了評判的標準。Canalys分析師鐘曉磊對第一財經記者表示,現象級的AI原生套用仍有待出現,如果AI原生套用能重新塑造流動互聯網內容消費的現有習慣,那麽對於端側效能需求有望加速舊器材的淘汰。
分級標準落地
在互聯網廠商仍在討論誰是「中國版ChatGPT」時候,手機廠商以及終端產業鏈玩家也在尋找大模型為產業帶來的新機會,試圖從中分得一杯羹。但當聲量聚集時,雜音以及復雜的話術使得「AI手機」成為了一個廣泛且模糊的概念。
「能夠提供生成式AI能力的手機並不等於AI手機,甚至相去甚遠。」一位頭部國產手機廠商負責人此前對記者表示,做AI手機想像快餐一樣,反倒會適得其反。
什麽是AI手機?如何定義AI手機的能力?能消圖的就是AI手機了嗎?面對這些問題,中國資訊通訊研究院在最新釋出的報告中提到,終端智能化水平目前分為L1-L5五個等級,不同等級對應人、終端不同的角色定位,智能化等級越高,終端在任務完成過程中的自主參與度越高,人的參與度越低。
換言之,擁有上述分級能力的某種程度上可以稱為具有AI能力的終端產品,但之間的能力差異非常大。
以出行場景為例,在L1級別中,使用者輸入資訊「幫我預訂一張北京到上海的機票」,終端可辨識並執行指令,開啟訂票軟件並輸入相應內容,但需要使用者自行瀏覽搜尋結果,選擇合適航班,填寫乘客資訊後自己完成支付。而到了L2,終端可以根據使用者偏好開啟訂票軟件自動搜尋機票,L3場景中,更是能提供制定方案。L4場景則會根據使用者的日常瀏覽動作辨識出潛在的旅遊需求並指定方案。到了L5級別,在沒有訂票動作的情況下,可以根據使用者的日常資訊推測出旅遊的想法,並規劃目的地以及方案。
可以看到,L1級(智能響應級)和L2級(智能輔助級)具備一定的智能化,可以基於使用者偏好完成單類別任務。到了L3級(智能助理級)以及L4(智能協同級),則逐步從感知辨識復雜意圖到辨識潛在意圖。而L5級(自主智能階)則具備全面的智能化,基於全場景進行自主規劃完成全類別任務。
但從L1到L5無疑是一項復雜的系統工程,需要產業各方協同合作、優勢互補,共同推動終端智能化水平提升。而從目前手機廠商布局的方向來看,各有側重點。
今年9月,榮耀在IFA展上正式釋出了全球首個跨套用開放生態智能體「榮耀AI智能體」,基於對使用者習慣的了解以及當前使用情景,可以理解使用者需求並迅速作出響應,執行、調取手機各類資源與三方服務。
榮耀CEO趙明表示,榮耀AI智能體瞄向的是「手機自動駕駛」,AI Agent不僅能呼叫自家系統內建的服務,還面向所有第三方服務開放合作,榮耀要做的是「平台級」的AI終端。
OPPO也在近日的開發者大會上展示了AI搜尋的能力。OPPO軟件工程事業部總裁唐凱表示,AIOS將經歷三個階段,從系統套用AI化到系統AI化,再到AI即系統。換言之,OPPO尋求的是先從底層系統與AI的相融合,技術側更偏向於自身系統的提升。
vivo的方向與OPPO類似。vivo AI全球研究院院長周圍對記者表示,今年的核心是AI重構系統體驗,不會局限在某個單一功能或者套用上,但具體會用什麽樣的方案,還在摸索。
蘋果在此前也展示了AI手機的功能,比如與蘋果語音助手Siri的結合,但從與OpenAI等大模型公司的合作看,蘋果在AI上的方向也傾向於做平台方。
「戰火」燒到了套用層
無論采取什麽樣的路徑,AI在套用層面的真正競爭已經開始。在完成了算力、大模型基礎構建的思考後,手機廠商中誰能更快地從L1走向L5,將決定未來在手機行業的身位。
具體來看,目前蘋果的AI功能主要集中在主流套用中,從相機、相簿、行事曆、備忘錄,到瀏覽器、電子郵件,系統中幾乎所有原生套用都將被AI賦能。此外,在蘋果智能的加持下,蘋果語音助手Siri的表現顯著增強,並且使用者在使用Siri和一系列套用期間,可以要求系統呼叫ChatGPT來進行回應。
與蘋果相比,國內手機廠商則開始給出了更加具體的AI手機套用場景。
不久前,榮耀陸續公布了「一句話點外賣」「一句話轉發文件」等AI功能。以「一句話轉發文件」為例,使用者向手機發出語音指令,與手機系統融合的榮耀AI智能體在理解使用者需求後,按照「搜尋、選擇、分享」的步驟發送檔,支持跳轉至微信App並選擇對應聯系人。
「AI智能體不僅能夠聽懂你的語意,關鍵是它可以理解螢幕上即時反饋的資訊,並模仿人的理解來進行相應操作。」趙明表示,更為復雜的AI手機可以在第三方套用內模仿人來認知、理解套用的內容,並且模仿人來進行相應的操作。
OPPO則在開發者大會上推出了SenseNow框架,透過小布助手支持連續對話、景點辨識。OPPO稱,場景方向上,目標是讓AI實作「聽得清、看得懂、做得快」多模態直覺互動,從而理解使用者的復雜意圖,完成跨套用的操作,
vivo則將更多的能力下放至「小模型」上,比如影像模型、聲音模型。
比起什麽都做,周圍認為需要基於現有的場景做AI能力疊加才有發展的可能。「比如說我們今年做了11種模型,第一版做了20多種語言,明年40種,後年可能是60種、80種,80種語言只要一個模型就可以搞定,當這種東西越來越多的時候,這個時候的手機就會出現體驗上的差距。」周圍說。
提起和蘋果AI在套用層的差別,趙明認為,目前國內手機廠商的作業系統已經具備了更強大的能力。「廠商過去需要跟著安卓的節奏走,但現在安卓承擔的更像是內核或者框架的作用。現在各家廠商都在系統層面投入,探索場景化的具體落地方案。在AI加持之後作業系統走向個人化,其實就是器材的千人千面。」
Counterpoint Research智能電話行業分析師Archie對記者表示,手機原來只是個工具,但在未來會變成了一個外腦,不再只是一個硬件狀態。
Archie認為,套用場景探索中,多模態的輸入和輸出能力相結合,可以極大強化智能電話的生產力工具內容,既可以基於多種形式的輸入資訊,生成使用者需要的圖表、文本、音樂、圖片甚至是影片,也可以對輸入的圖片、影片進行編輯,這些新的技術變革能夠逐步激發消費市場新的需求。
但也可以看到,硬件層面的AI芯片推理能力以及軟件層面的互動方式都對AI手機本身提出了更高的要求,成本和技術方案都來到了關鍵節點,而除了硬件外,各大手機廠商還需要圍繞如何利用AI為使用者提供個人化的服務展開。
(本文來自第一財經)