三問AI手機：什麽意圖？怎麽辨識？何種框架？

2024-08-21手機

文｜腦極體

早在幾個月前，就有媒體同行問我：AI手機到底是什麽？跟智慧型手機有什麽本質的不同？

試想一下，如果經常跟科技企業、技術趨勢打交道的媒體人、分析師都對何謂AI手機雲裏霧裏，更別提門店銷售和消費者了。

2024被認為是AI手機元年，但今天走進線下門店，會發現店員和使用者都對手機裏的AI有啥不一樣，感知並不明顯。

行動網際網路時代，我們常說手機是人「肢體」的延伸，可以讓我們的「手」觸及更遠的地方，「看」到更廣闊的事物。到了AI時代，手機是「大腦」的延伸，心念一動、言出法隨，手機會根據我們的使用習慣和意圖，主動提供有價值的服務。

所以， AI手機區別於智慧機的一個更高階、更本質的能力，就是「意圖辨識」。

目前，蘋果陣營、華為鴻蒙陣營、榮耀OV安卓陣營，都將意圖辨識作為重點。

蘋果CEO庫克在AI系統「Apple Intelligence」的釋出會上重點強調，在「蘋果智慧（Apple Intelligence）」的支持下，Siri具備了精準辨識使用者真正意圖的能力。

而安卓和鴻蒙使用者，恐怕對此並不陌生。

華榮OV等國產手機廠商早就上線了相應能力。榮耀在2023開發者大會上帶來了行業第一個基於AI意圖辨識的人機互動（IUI）作業系統——MagicOS 8.0；華為在HDC 2024上提出Harmony Intelligence，使得小藝能力大幅提升，能夠理解並預測使用者需求，並透過意圖框架與合作夥伴套用場景整合。

OV雖然沒有明確推出意圖框架等平台，但也用行動參與其中。將大模型融入系統的底層設計中，升級OriginOS、BlueOS，來實作復雜的意圖辨識和推理決策。

那麽使用者又該迷惑了，各家都在說「意圖辨識」，到底有啥不一樣呢？

「意圖」是人心中所想，帶有模糊和不確定性，「辨識」結果也就有了很大的自由闡釋空間，廠商如何避免自說自話，把「手機懂你」這件事落在實處？

就要依靠一個作業系統級的全域意圖感知、理解、決策技術體系。

我們不妨把「意圖辨識框架」這一新概念詳細拆分開，看看每一個環節的準入門檻是什麽。

意圖辨識的第一步，當然是搞清楚什麽是使用者的「意圖」，也就是手機廠商所說的「懂你」。

但「意圖」並不是什麽新概念。

早在互聯網時代，意圖辨識就被套用於搜尋引擎、廣告推薦等場景。比如使用者在搜尋框輸入「抓娃娃」，底層的檢索策略要辨識到這是電影需求，再去電影的資料庫裏檢索，如果電影意圖辨識失敗，返回的搜尋結果中，根本沒有【抓娃娃】電影相關內容，或者要翻好幾頁才顯示，都會導致很糟糕的使用者體驗。所以，意圖辨識很早是科技企業研究的物件。

那麽，AI手機所謂的「意圖辨識」，有啥特殊呢？

特殊在於，要遊過深海。

今天手機所承載的「意圖」，有兩個特點：

一是範圍廣。 一個動作或詞語可能對應多個意圖。現代消費電子裝置的激增，帶來了豐富多樣的功能和服務，幾乎涵蓋了我們生活的方方面面，終端裝置的多元、服務的多樣，經常會出現多種意圖，比如輸入「長城」，可能是景點、電影或者汽車，這就使手機的意圖辨識更難做。

二是隱蔽性。 傳統意圖辨識可以根據使用者給出的query詞來進行判斷，屬於相對明確的「顯性意圖」，但日常使用手機時，還有大量隱性意圖，比如眼睛註視手機螢幕，可能是想看時間、看新訊息通知或日程計劃；遺忘了出行計劃，可實際上航班時間應該重點關註……這些是使用者真實需要，但自己很少意識到或清晰表達出來的「隱性意圖」，由於無法被清晰表達，難以轉譯成電腦語言，自然也就難以滿足。

這些多且隱蔽的意圖，構成了一片「意識深海」，需要手機廠商跋涉而過，找到一條最短路徑。

由此，我們不難明確，AI手機意圖辨識的意義：

首先是化繁為簡。透過洞察使用者真正的需求，簡化獲取服務的步驟。

比如榮耀的「任意門」功能，帶來了行業第一個基於意圖辨識的人機互動，只需一拖不到1秒即可完成以往8步10秒的操作流程。當使用者收到一條資訊，復制之後，系統會自動分析語意並提煉關鍵內容，預判接下來的需求和操作，自動一步直達備忘錄、地圖等套用。華為智慧搜尋支持「一鍵場景直達」、OPPO的ColorOS 14系統中的「流體雲」功能，能預測使用者行為，自動接入相應的使用場景……這些都簡化了操作步驟。

其次，多想一步。透過隱性意圖的辨識和滿足，帶來超出使用者期望的驚喜體驗，構建差異化優勢。

華為曾在一次分享會中提到，HarmonyOS意圖框架可以透過長時間的學習訓練，把人們自己都感覺不到的規律串聯起來，並透過端側的本地學習完成本地學習推薦，從而完成「超預期」的智慧搜尋服務體驗。

接下來，可以主動服務。比使用者多想一步，就能將服務化被動為主動，更快更恰當地送到使用者的眼前指尖。

目前，鴻蒙系統的場景化入口，就可以根據意圖判斷，將不同服務融入實際場景中，比如搭乘飛機，航班資訊會優先顯示在即時狀態列，榮耀Magic Live也有類似的主動服務，在觀影、聽歌、走進地鐵站等場景中，提前將取票、聽歌偏好、地鐵碼等原子化服務進行推播。

基於意圖辨識的人機互動，讓你最需要的服務，涉過意識的深海。

洞察到了使用者的意圖，就能將服務精準送達嗎？其實還要穿過一片AI的叢林。

有一個職場段子，老板讓秘書定一個航班，最低段位的秘書，就只會看那一班，而最高段位的，還會提供多個航班選擇，還考慮到出差需求，也把當地的住宿、餐飲等都提前查好備選。

如果讓手機AI來應聘做你的助理，你希望是哪一個段位呢？

最高段位的AI助理，要真正理解你說的話背後的真實意圖，並真正完成你想要的任務，其實要拆分為幾個步驟。

步驟一：充分感知。 一個優秀的助理，並非「胡子眉毛一把抓」，什麽事情都要提前安排， 而是結合上下文背景和情境，來對使用者的潛在意圖進行判斷 。所以，充分感知場景和情境，就非常必要了。

蘋果高級副總裁Craig曾表示，Apple Intelligence的真正獨特之處是能理解個人情境。能夠根據你的個人數據，你現在開啟的頁面等背景，來理解需求。

比蘋果更早一些，榮耀在2016年第一代Magic上先發Magic Live智慧系統，就能夠自動感知判斷。

步驟二：分析判斷。

有了上下文背景，怎麽推斷多個意圖的重要性和優先級呢？這就涉及語意理解了。 目前，檢索、問答等任務，由於使用者有明確的檢索詞，利用大模型的自然語言理解能力，已經可以很好地推斷使用者到底想幹什麽。

其中比較具有代表性的是Apple Intelligence蘋果智慧+ GPT-4o大模型的方案。基於Apple Intelligence，蘋果為Siri引入了多模態互動能力，可以從輸入的自然語言中精準地進行使用者意圖辨識，將任務拆分為多個任務，作為生成回答的基石。

步驟三：精準執行。

我們可以把每一個服務和功能，想象成一個個智慧體， 每個智慧體只有孤立的辨識和輸出能力，要完成使用者需要的復雜任務，需要對這些智慧體進行精巧地、自動化地調取和編排 ，才能在意圖判斷之後，做出最恰當的執行反饋。

OPPO與IDC聯合釋出的【AI手機白皮書】中提到，成熟的AI手機系統要內嵌使用者定義的專屬智慧體，不斷理解使用者習慣，自學習、直覺化。

在VDC開發者大會的一場技術論壇中，vivo的技術人員也透露，作為業內第一個推出手機大模型（藍心大模型）的廠商，他們很早就開始研究agent，對手機原生化服務元件的拆分很細、編排恰當。

這樣看，從意圖到服務之間，還要經過數據（感知）、演算法（分析）、智慧體（執行）的一片AI森林，只有具備完整AI技術體系的廠商，才能順利跑通。

從上述意圖辨識的拆解中不難感受到，AI手機想做的「以人為中心」的主動服務，跨裝置的數據流轉（全場景感知），跨套用的服務觸達，以及全域安全，是必不可少的。

如何將各層級、各終端、各系統、各套用都整合在一起？

意圖框架，就是關鍵紐帶，具備作業系統平台級的能力，可以讓AI貫穿從數據到服務的完整鏈路，帶來意圖辨識的能力飛躍。

目前，榮耀、華為、蘋果都推出了自己的框架或平台。

其中，Magic Live智慧引擎是基於場景感知、使用者理解和意圖決策三大核心能力的平台型AI解決方案，形成了一個能夠銜接各種軌跡和能力的「大腦」，實作了從單意圖到多意圖關聯的精準意圖判斷。

蘋果也采用了「榮耀模式」，App Intent意圖框架包含了自學習引擎，即時學習使用者行為，並根據時間和空間資訊，提供個人化服務。

華為HarmonyOS的意圖框架，則構建全域意圖範式，基於鴻蒙系統的跨端互聯協作優勢，實作多維系統感知，結合AI大模型、AI推理框架、端雲協同等計算處理能力，將需求傳遞給服務方，拉起/執行更恰當的服務。

總結一下榮耀、華為、蘋果的意圖框架，就是具備「地基」的能力。

為了更好的意圖理解，三家都進行了深度的技術搭建，實作了作業系統級別、跨終端的意圖感知、理解，只有深入到系統層面，才能真正重構手機AI體驗。

同時，意圖辨識會涉及敏感數據的采集、共享和流動，在私密安全方面，無論是一貫以私密保護著稱的蘋果，還是榮耀的MagicGuard和MagicRing信任環，華為HarmonyOS NEXT的原生安全，都說明唯有平台級的AI能力，能在釋放智慧的同時，守住安全的防線。

說到這裏，你是不是有點疑惑，既然意圖辨識這麽難、需要改造和創新的地方這麽多，效果也不是一時半會兒能體現出來的，主打一個「誰用誰知道」，要不還是先躺平算了。

確實，意圖辨識的每一關都不好過，但這正是競爭白熱化、同質化的手機市場，廠商突圍的關鍵。

更何況，AI手機應該是消費電子市場最大的一個新蛋糕，華榮OV等一批國內廠商又早已「上桌」，只要攻克一些技術難關，就能成功分到大蛋糕，何樂而不為呢？

意圖辨識框架上，正在醞釀一場從「以手機為中心」到「以人為中心」的互動之變，AI手機才剛剛萌芽。