當前位置: 華文世界 > 手機

AI手機,蘋果摸著安卓過河?

2024-08-09手機

作者 | 雲鵬
編輯 | 心緣

做AI, 蘋果摸著安卓過河? 未必。

智東西8月1日報道,最近,蘋果正式釋出iOS 18.1開發者測試版,蘋果畫的「Apple Intelligence」大餅,總算是先讓開發者們嘗到了一小口。

Siri告別「智障」,語言理解能力大幅提升,寫作工具、圖片工具這些釋出會上的亮眼功能也部份在蘋果系統App中落地。

蘋果的開發者們,似乎已經提前「開香檳」了,相關上手影片直接在科技圈炸了鍋。

為什麽蘋果AI如此受大家關註?這離不開最近半年多AI手機圈的火爆。

當智能電話全面轉向「AI手機」時,所有廠商都在緊鑼密鼓、加班加點地上馬新功能,生怕掉隊一絲一毫。

從2023年8月至今,短短不到一年的時間,華為、小米、OPPO、vivo、榮耀五大中國手機巨頭都已經完成了自家AI手機作業系統多個版本的叠代,各類基於端側、雲側AI大模型實作的AI功能如雨後春筍般湧現。

▲安卓旗艦機上的各類生成式AI功能

文本生成、影像生成、AI摘要、AI總結、AI搜圖,更自然的互動對話、更出色的意圖辨識和理解能力, 半年前還新鮮的AI功能如今已經成為AI手機的「標配」。

相比之下,蘋果釋出Apple Intelligence帶來的升級, 似乎並沒有滿足業內和消費者們對於蘋果的期待。

因此,當很多人看到蘋果AI之時,都會下意識的想到:安卓早就做過了。因此有一個結論逐漸被很多人所提及或認可: 做AI手機,蘋果是在摸著安卓過河。

事實真的是如此嗎?當我們逐幀拆解蘋果在WWDC上演示的一系列AI功能,並嘗試在五大國產安卓旗艦機中「對號入座」時,我們發現一個有些「唱反調」的事實: 大部份蘋果的AI功能,安卓陣營都做不到。

▲蘋果VS安卓,蘋果WWDC關鍵AI功能對比

同樣的功能,安卓即使可以透過其他方式變向實作,從根本的實作邏輯上與蘋果也有所區別。

▲智東西深度體驗國產五大旗艦機的AI功能,從左至右依次為:vivo X100 Ultra、小米14 Ultra、OPPO Find X7 Ultra、華為Pura 70 Pro+、榮耀Magic6 Pro

做AI手機,蘋果絕不是在摸著安卓過河, 蘋果做AI的思路和方式,甚至還有很多值得安卓陣營學習的地方。

前不久三星在釋出會上一系列AI功能對蘋果的像素級「模仿」,恰恰也證明了蘋果方向的正確性。

與其高歌安卓陣營在AI功能落地速度上的「遙遙領先」,不如將蘋果AI吃透,將蘋果AI與安卓的核心差異點摸清,取長補短,為我所用。

AI手機的競賽絕不是百米賽跑,一定是一場「馬拉松」。 第一個跑的不一定第一個到達終點,誰的後勁更足,才是重頭戲。

AI手機這場精彩的較量,選手們才剛剛到齊。

一、都是生成式文本影像能力,蘋果贏在了「系統級」整合

在對比蘋果AI和安卓AI之前,我們要先弄清一個關鍵問題—— 蘋果AI到底是啥?

在逐幀拆解蘋果WWDC關於AI的部份後,我們可以清晰地梳理出蘋果AI的五個關鍵能力組成部份:

1、理解生成語言和影像

2、跨套用操作能力

3、個人化專屬能力

4、智能體

5、雲端大模型呼叫

其中最重要的是前四個部份,尤其是智能體Siri的重要升級。我們這次暫時只對比前四個。

有一個結論要明確, 蘋果AI絕對不是「OpenAI換皮」。

蘋果做AI,最最最不想做的一件事,就是呼叫ChatGPT。

用通俗的話來講, 在蘋果的AI體系中,只要是能端側解決的,堅決不能上雲, 只有實在沒轍了的時候,才會「不情願」地呼叫一下雲側大模型,呼叫時還要「層層設防」,生怕使用者一個不留神交出了自己的敏感數據或資訊。

蘋果在釋出會上透露,蘋果在端側跑了三四十個模型,這些模型服務於各類功能,而這些功能融入在系統體驗的各個環節。

這就是在對比過程中我們感受到安卓與蘋果差距最大的一點——端側系統級AI體驗,這也是我們對比分析的重點。

到底,什麽是系統級?什麽是系統級AI?

現在很多國內的安卓廠商也在強調自己的AI功能並不是「下載一個App」那麽簡單,已經是與各個套用相結合了,但從實際「療效」來看,跟蘋果的邏輯還有所不同。

比如在理解和生成語言、影像這件事上,蘋果的邏輯是把這種能力直接潤物細無聲地做到日常體驗的各個環節。

在需要的時候可以迅速呼叫、比較無感,操作符合直覺,幾乎沒有學習成本。

安卓陣營的許多手機都推出了各類文本生成和總結的功能,比如我們可以呼出智能助手,然後讓它幫我們生成一段精彩的文案,或者幫我們總結摘要一段通話錄音。

▲安卓旗艦機在筆記App中加入的AI文本創作功能

當然,我們也可以直接呼叫各家的智能助手,將手機裏的文件發給它,讓它幫我們總結重點。

這裏有沒有發現什麽特點? 這個功能或者服務的發起者,仍然是「我們」,也就是人與AI的互動,仍然是人要主動發起。

相比之下,蘋果在理解和生成語言、影像環節是怎麽做的?

在鎖屏通知顯示環節,AI會直接理解你收到的通知的文本內容,判斷重要性,並將重要的套用通知前置。

雖然安卓手機可以手動設定重要套用的通知置頂,但跟蘋果這種AI主動判斷完全不同。

在顯示通知的同時,蘋果AI會把通知的內容以摘要的形式簡要呈現出來,方便我們判斷資訊的重要性,郵件也是如此。

跟顯示通知很類似,蘋果AI還可以直接把我們收到的郵件中的要點資訊提煉並放在郵件的開頭。

這一切不需要復雜的操作,不需要選中文本內容,也不需要下載某個App。蘋果很多的AI功能,會給人一種自然而然的感覺:

當你覺得某個地方如果AI幫我做一下就好了,蘋果AI已經做好了放在那裏供你參考使用。

你不需要思考我應該呼叫什麽工具,我應該開啟什麽軟件,我應該如何召喚出語音助手幫我做這件事, AI都已經「無處不在」地幫你做好了。

這,是蘋果AI最顯著的特點之一,這也是「系統級AI」的典型體現之一。

其實這種「系統級AI」能力,在蘋果AI處理文本、影像方面都有鮮明的體現。

蘋果在釋出會上釋出了兩個工具,一個是書寫工具,一個是影像生成工具,但大家千萬不要覺得這個「工具」就等於某個App,我們需要開啟某個App才能使用這個功能,並非如此。

▲書寫工具

形象地來說, 使用蘋果的這個AI功能,就好像我們用電腦辦公,點選滑鼠右鍵一樣自然。

蘋果特別在釋出會上強調說,不論是書寫工具還是影像生成工具,都是 「全系統適用」。

簡單來說,文字工具可以用在任何有文字的地方,從郵件、備忘錄、瀏覽器、Pages、Keynote到各類三方App,影像生成工具同樣如此。

我們開啟一個活動邀請的郵件,AI會自動辨識邀請函的內容、需要我們回答的問題並提供智能選項,我們是接受邀請還是拒絕?選擇後AI就會快速生成回復郵件的草稿。

我們只要選中郵件文字內容,書寫校對功能就會彈出來,我們可以對內容進行潤色,更換不同的語氣口吻。

一切流程都很自然, 我們想到了,AI就已經做到了。

安卓陣營這邊,其實大部份廠商很早就落地了各種文本生成、文案創作類的功能,比如幫我寫一個商品評價、寫一個會議邀請的郵件、寫一個簡短的自我介紹或是一個臨場演講發言。

如果就文案創作的豐富程度來說,蘋果似乎還要稍遜一籌。

▲安卓旗艦機中的各類文本生成、文案創作功能

但問題在於,這些功能往往藏在一些App中,或者需要我們調出智能助手,將我們需要讓AI總結、重寫、潤色的內容先發給助手,助手再去解讀。

有些安卓機型的文本潤色重寫功能做在了「筆記」套用中,但實際上這可能是一個我們平時生活中非常「低頻」開啟的一個套用。

當然,一些 安卓廠商將AI文案的寫作、潤色這樣的功能做到了輸入法裏,相對來說,這還算是一個比較「系統級」的App

▲部份安卓旗艦機將AI寫作功能做到了輸入法中

從最終結果來看,安卓這邊都可以變向,或者多幾個步驟實作同樣的生成式文書處理功能,但跟蘋果AI所做的「系統級AI」相比,並不相同。

影像也是如此。

生成式影像處理一直是安卓陣營津津樂道的一大優勢專案,很早安卓這邊就推出了類似一句話生成影像、影像風格最佳化、AI摳圖、AI路人消除這樣的功能。

今天一提到AI手機,很多普通人的第一反應就是AI消除、AI生圖。

相比之下,蘋果在釋出會上強調的AI生圖能力有些不同:

蘋果的AI可以在聊天中隨時隨地根據朋友的照片生成一張帶有特定氛圍的卡通圖片。

同樣是在聊天場景中,我們可以隨時讓蘋果AI根據我們的描述生成一張表情圖。

AI還可以直接辨識我們選中的聯系人頭像,根據手機中這位聯系人的照片生成相應的表情包影像,這一切都不涉及任何套用跳轉。

AI可以在你記筆記的時候隨時根據你記錄的文字內容生成相關的影像。

比如根據你記的建築學筆記生成一副建築的影像,並且影像中哪些建築特點是根據哪些文字生成的都可以一目了然的直觀呈現。

蘋果的AI影像生成功能同樣是做到了「系統級」。

在我們使用各類套用時,只要我們需要生成影像,生成影像的功能就可以馬上發揮作用,不需要我們跳轉到另一個地方,去生成一個圖片,再復制貼上回來。

蘋果與安卓的邏輯依然不同。

當然,像AI路人消除、AI照片搜尋、AI影片生成,以及常規AI文生圖這些功能都是蘋果AI和安卓AI通用的能力,大家也看的很多了,這方面差距並不大,我們不必贅述。

但我們需要關註的是這些功能具體的套用效果,比如影片生成的精美程度,是否傳達出主題,這些有待蘋果AI正式落地後進一步關註。

系統級AI是什麽?看下來有幾個關鍵詞:

自然而然、隨時隨地、操作極為簡單、主動提供、高可用性。這就是蘋果的系統級AI。

二、蘋果與安卓達成共識:打造理解個人情境、個人化專屬AI

在分析系統級AI時,有一個很重要的AI特性,是「主動性」,這個特性的實作,牽涉到蘋果AI的另一層關鍵優勢: 對個人情境的理解。

用蘋果高級副總裁Craig的話來說, 這是個人智能化極為關鍵的要素。

對於個人情境的理解 與AI的個人化專屬能力也緊密相關,簡單來說,就是 AI真的要懂你、了解你。

什麽叫懂你、了解你?

蘋果的AI,可以給你的照片、行事曆日程、各類檔、往來訊息和郵件中的資訊等內容建立語意索引,相當於 你的一切個人化資訊都被AI所理解、記住了,你再讓AI辦事的時候,AI就可以很自然的利用這些資訊。

AI認識你,認識你的朋友、家人,AI了解你最近的日程、手機裏儲存了哪些重要的檔。

比如在你填表格需要輸入某個證件號碼的時候,AI就可以直接幫你找到那張證件的照片並自動將駕照編號提取出來,填入表格。

蘋果高管在釋出會上舉了一個形象的例子:

當一個臨時會議突然出現,你不知道還能否趕上晚上女兒的音樂會時,AI可以幫你做出判斷,AI會知道你今天的日程安排,知道你的女兒是誰,知道你女兒前幾天發給你的音樂會海報,提取其中的時間地點資訊,AI也會知道你的公司在哪裏,從而規劃路線和時間。

目前,這些安卓陣營暫時都做不到。

這一切,都是基於AI需要真的了解你。

只有真正了解你,能夠理解你的個人情境,才能說得上是個人化專屬的AI, 也就是我們夢想中的「賈維斯」。

在安卓這邊,AI對我們的了解更多停留在我們每天幾點通常會使用哪個套用,然後在對應時間段就會將套用建議放在桌面的醒目位置這樣的水平。

當然,我們也可以在圖庫中自訂聯系人,定義誰是媽媽、誰是妻子,AI就可以搜到「媽媽的照片」、「妻子的照片」。

▲安卓旗艦機相機App中的人物自訂功能

蘋果這種個人情境理解能力,實際上在前文提到的生成式文本、影像功能中也有體現。

比如AI會基於你當前跟朋友聊天的情境智能推薦生成相應的圖片,比如AI會知道你跟哪個朋友在聊天,你們聊的話題是輕松愉悅的,還是緊張壓抑的,進而推薦相應的圖片生成提示詞供你選擇。

在蘋果看來,AI唯有真正可以理解你的個人情境,才真正變得有價值。

這話誠然不假,但實作起來卻並不容易, 資訊需要打破套用的邊界,為AI所掌控,AI智能體掌握著所有關鍵資訊,同時知道你當下在做什麽、需要什麽,並自然而然地提供相應的AI服務和建議。

雖然安卓陣營也一直在向這個方向努力,但不得不說,目前絕大部份AI功能,人都需要率先發出請求,並且在操作的繁瑣程度上也要超過蘋果,AI的主動性體現,仍然較少。

總體來看,安卓陣營目前的「個人化AI」,更像是「人工個人化」,我們仍然需要手動設定大量的自訂資訊,才可以讓AI獲得更多的資訊,而不是AI主動對我們的資訊進行學習、理解,建立語意索引。

這跟蘋果AI是有本質區別的。

▲安卓旗艦機中對於個人資訊與偏好的設定界面

三、AI跨套用操作成主流,國內套用生態繁雜或成最大挑戰

正如前文所說,蘋果AI實作個人情境理解的一大前提就是資訊不在停留於每個角落、每個套用中,而是打破邊界,實作「流動」,為AI所用,這其實就牽涉到了蘋果AI的另一大關鍵能力—— 跨套用的操作。

在跨套用操作方面,安卓陣營的確已經做出了不少成果。

比如我們可以很輕松地讓AI找到手機中關於某些內容或主題的檔,找到某位家人或朋友的照片,找到一首特定的歌曲。

▲讓智能助手找檔

我們還可以將找到的文件發送給微信中的某位聯系人,或者直接讓AI給我們的某個微信聯系人發一個指定金額的紅包。

▲給指定微信聯系人發指定金額紅包

這些方面,安卓AI與蘋果AI的差距並不大。

這裏有一個問題需要註意,也就是我們前文所提到的「套用生態存在巨大差異」的問題。

在海外市場,AI功能與蘋果系統級套用的結合是極具價值的。 因為絕大部份蘋果使用者都被系統套用生態強繫結,是真的在用這些App。

相比之下,中國安卓手機廠商面臨的最大挑戰之一,恰恰就是套用生態過於龐雜, 每一類套用,都有無數「主流套用」。

▲安卓市集

蘋果AI可以只把郵件套用做好就可以提升絕大部份人的辦公AI體驗,但在國內,把辦公體驗做好牽涉到的App數量難以想象,甚至每家公司都在使用獨立的辦公套用。

▲安卓市集

對於國內安卓手機廠商來說,一些系統內建的郵件、瀏覽器、音樂、影片、筆記等軟件,恰恰是使用者不常使用的。

國內安卓手機AI跨套用的操作、AI功能與套用的深度融合,必然涉及到產業各方的共同努力。

問題如何解決?安卓或許仍然可以跟蘋果取經。

蘋果 讓三方App也可以快速接入蘋果AI,使用蘋果AI,或被蘋果AI所使用。

目前國內一些安卓廠商也在向著這一方向努力,推動開發者將套用提供的服務轉化為一個個AI可以呼叫的能力,而AI所具備的功能也可以被各類三方套用所呼叫。

可以說, 生態這件事,還要用生態的思路來解決。

四、AI手機時代:智能系統就是智能體,智能體就是智能系統

既然我們最開始就提到,智能體是蘋果AI裏非常重要的一部份,那我們為什麽最後才來說Siri?實際上,在AI手機時代,智能體與AI系統之間並沒有那麽清晰的邊界了。

一個個人化智能系統,實際上就是一個個人智能體。

上述提到的所有蘋果AI的能力,實際上就是Siri的能力。

不論是文本、影像的生成式創作,還是個人情境的理解,亦或是跨套用的操作,我們都可以透過Siri來完成操作,服務也可以由Siri直接提供。

在AI手機時代,智能系統就是智能體,智能體就是智能系統。

理解生成語言和影像、跨套用操作能力、個人化專屬能力、智能體這四個蘋果AI重要組成部份,實際上是相互關聯,相互深入,你中有我我中有你的。

當然,在智能體這個環節,還是有一些功能是可比的了,比如自然的語言對話能力、上下文聯系理解能力,以及一些語音助手更常用的功能。

在自然語言對話理解方面,其實目前各家的差異並不大, 這裏我們不需要過多對比。

▲透過語音助手設定日程

Siri這邊能夠讀懂、理解螢幕內容並執行相應操作的能力給我們留下了比較深刻的印象。

▲Siri的AI識屏

目前安卓陣營各家AI也幾乎都已經具備了AI識屏的能力,比如 透過雙指長按螢幕,AI就會對螢幕內容進行分析。

我們可以點選地址資訊跳轉到導航App,點選日程安排資訊建立日程,或者點選電話號碼建立聯系人。

▲安卓旗艦機的AI識屏功能

當然,AI也可以辨識某個圖片中的人物。

▲安卓旗艦機的AI識屏功能

總體來看,智能體這一環,反而是安卓與蘋果陣營差異最小的一方面,智能體,其實更多承擔了AI與人互動的「入口」功能,也就是資訊輸入輸出的視窗。

蘋果和安卓的核心差異,仍然存在於智能體背後整個智能系統的能力、底層邏輯、實際體驗等方面。

結語:AI手機,讓子彈再飛一會兒

當我們細心逐幀梳理並對比蘋果AI和安卓AI後,我們發現,最核心的差異其實並不在於表面上看到的那些功能,比如AI寫作、AI生圖、AI摘要或是AI路人消除。

這些AI功能並不是最大的挑戰, 難點在於如何將這些AI能力內化到系統的每一個組成部份、每一個套用,每一個體驗的細節中,這也是蘋果AI和安卓AI核心的差異。

說「蘋果摸著安卓過河」,更多是從表面AI功能上來看的,但實際上,這就像如今手機作業系統功能設計趨同一樣,「表面上看起來一樣」是一件再正常不過的事了。

在使用過國內五家頭部廠商的旗艦機AI後,我們也能感受到,各家的AI真正用起來的體驗,的確有著不小的差異。

當然,話說回來,蘋果的AI目前來說仍然是「一張大餅」,雖然釋出會上的功能演示都是用真機進行的,但真正未來蘋果AI落地能有怎樣的體驗,還是個未知數,蘋果AI國內的體驗,同樣是未知數,半年甚至一年後,等蘋果AI全面落地後,國內安卓廠商又會放出怎樣的AI大招,也是未知數。

在這麽多「未知」的前提下,我們不如讓子彈再飛一會兒。

哦對了,說一千道一萬,蘋果說的所有的AI,現在還是「一張大餅」。

最後到我們手裏長啥樣,這事還真沒準呢。