當前位置: 華文世界 > 科技

蘋果被大模型打得措手不及

2024-03-26科技

文 | 蔚然先聲,作者 | 張從白,編輯 | 周在安

2023來,輝達憑借其AI硬件業務的強勁表現,實作市值6.3倍增長,達到2.36萬億美元。ChatGPT、Sora等生成式AI的釋出,更使科技行業邁入全新的發展階段。

在可預見的未來,AI的重要性日益顯現。未能有效把握AI發展機遇的科技企業將面臨被市場淘汰風險。在美股「七巨頭」中,唯獨蘋果 在AI布局上表現極為謹慎,備受外界關註。

3月20日,庫克在微博稱自己到訪上海,此行的目的之一是參加Apple靜安店的揭幕儀式。據悉,這家直營店的規模全球第二。盡管庫克外灘散步,並品嘗了上海的早餐,但此刻他並不輕松,因為眼下的蘋果飽受爭議。 3月21日,美國司法部和十幾個州的總檢察長對蘋果公司提起了反壟斷訴訟。隨即,蘋果股價低開低走,收跌4.09%,報收於171.37美元,創下自2023年8月4日以來的最大單日跌幅。其市值一夜之間蒸發超過1100億美元。

業務方面,據市場調研機構Counterpoint Research最新數據顯示,今年前六周,iPhone在中國銷量同比下降24%,整體排名第四。根據蘋果公司2024第一季財報數據,大中華地區該季度營收為 208 億美元,同比減少13%。

產品布局方面,蘋果發售了XR穿戴器材「Vision Pro」,雖然發售當日加價6萬,但如今已因體驗不成熟而跌破發行價,引發退貨潮。

籌備10年,投資超過100億美元的蘋果「泰坦」造車專案也被取消,大部份汽車團隊成員將被轉至人工智能部門,取消造車的原因我們在文章【蘋果也無法在造車上找到差異化】做出了分析,這裏不多贅述。

外界普遍認為,蘋果若想繼續保持領先地位,關鍵在於其AI領域的布局成果。天風國際分析師郭明錤曾評價指出:如果蘋果今年無法推出優於市場預期的生成式AI服務,那麽輝達的市值很可能將超越蘋果。

我們認為,蘋果在人工智能技術並不是毫無準備,但以OpenAI為主的生成式AI發展如此迅速,讓蘋果公司始料未及。顯然,蘋果是落後於AI發展的時間線了,為了安撫投資者與使用者,庫克於上海期間也再次強調:「蘋果的生成式AI,在今年晚些時候會有新聞宣布」。

蘋果的AI路

1985年,喬布斯在瑞典隆德大學發言:「我希望有一天,當下一個亞里士多德出現時,我們可以用一台電腦捕捉亞里士多德的基本智能。這樣,後代的學生就可以向亞里士多德提問,並且可以得到回答」。

喬布斯幾乎預見了大模型技術的崛起,並堅信人工智能將為蘋果公司帶來遠大前景。Siri是由喬布斯主導,蘋果公司對人工智能最早的探索,但在庫克時代,蘋果在人工智能領域的發展步伐卻有所減緩。

蘋果AI的發展可以分為三個階段:

Siri階段

2010年,蘋果就以2億美金收購了「Siri」專案,並將其發展為串聯蘋果生態的智能語音助手。Siri釋出的同時,正逢科幻電影【鋼鐵俠】大熱,其中的人工智能「賈維斯」仿佛就是Siri的完全體,讓使用者無限期待。

然而,盡管Siri已經歷了長達14年的叠代更新,但使用者對其的評價卻相當糟糕。Siri幾乎未展現出明顯的進步或提升,其功能仍然主要局限於查詢天氣、設定鬧鐘、講述笑話等簡單任務。在面對更復雜的對話場景時,Siri往往無法妥善處理,轉而直接跳轉至搜尋網頁。此外,Siri在語言的辨識以及句式的理解方面也存在較大缺陷,因此常被戲稱為「人工智障」。

Siri表現不佳的原因其實並不難以理解,要想實作Siri內容更豐富、功能更全面、個人化更出色,必須不斷深入收集與分析使用者的錄音與行為數據。對於蘋果而言,其一直將使用者私密保護作為產品力的核心,因此,這樣的升級將與其產品理念產生較大的沖突。

2019年英國【衛報】報道稱,一名舉報者向他們透露,蘋果用Siri記錄使用者說話,引起軒然大波。這是因為蘋果使用外包團隊收集相關數據以對Siri進行最佳化。蘋果最終用全職員工取代了外包商,並且修改了相關規定,普通員工很難聽到Siri的對話錄音。

所以,Siri回答使用者時只能在預設的數據庫中尋找答案,【紐約時報】曾報道稱,Siri簡單添加單詞需要長達六周的時間,這讓Siri難以即時最佳化與叠代,逐漸遠離人工智能概念。

仿生階段

蘋果仿生芯片自2017年起沿用至今,它最早誕生於iPhone X/8/8Plus的A11 Bionic處理器。它是手機處理芯片中增加了一個AI運算加速內核,又稱NPU(嵌入式神經網絡處理器)。

這塊獨立內核主要負責語音、影像、影片的辨識工作,iPhone中的多項功能均依賴其運作。舉例來說,它能夠依據照片標簽自動生成回憶影片;快速提取照片中的影像與文字資訊;根據使用者的使用習慣最佳化任務處理速度;實作面部解鎖準確性提升等。這些功能的強大之處在於,它們均基於本地計算得以實作,無需依賴外部伺服器,

從而確保了使用者數據的安全與私密。也因為名為仿生(bionic),彼時外界普遍認為這是一顆人工智能芯片。實際上,仿生芯片特殊之處在於計算時不會幹擾到CPU和GPU的正常工作,能在極低的功耗下瞬時為使用者完成計算。但從另一個角度來說,這只實作了「人工」,並沒有實作「智能」,真正的智能應該是具有自我學習能力,而不是預設的計算方式。值得一提的是,高通在2017年也推出了具有神經網絡系統的SOC——驍龍845。

空間計算階段

庫克在 2023 年的WWDC主題演講中表示:「空間計算將數碼內容與物理世界無縫融合,同時允許使用者保持存在並與他人保持聯系」。顯然,此時蘋果是相信未來是屬於MR器材所打造的元宇宙的。

蘋果在2017年的IOS 11上首次展示了AR概念,並釋出了AR開發工具ARkit。配合正選於iPad Pro的LiDAR激光雷達,使用者能將原本不切實際或天馬行空的想法呈現在眼前。隨後,蘋果陸續推出空間音訊、增強現實等功能,最終這些線索被今年發售的Vision Pro所串聯。

蘋果對傳感器技術的運用頗為倚重。初代iPhone雖未配備鍵盤、3G功能以及自拍網絡攝影機,卻搭載了距離傳感器、光線傳感器乃至加速度傳感器等先進元件。這些傳感器的運用使得iPhone在智能化水平上遠超當時市場上的其他手機產品。

蘋果致力於透過傳感器與演算法技術,淘汰傳統的互動邏輯。iPhone的推出,成功使手機擺脫了手寫筆和鍵盤;空間計算領域,蘋果期望能夠突破螢幕與手持器材的局限性。而在汽車領域,蘋果更是寄望於大量傳感器與先進計算技術的結合,使使用者在未來能夠擺脫方向盤的束縛,實作真正意義上的自動駕駛。

因此,蘋果汽車專案同樣是傳感器與演算法技術套用的典型案例。盡管蘋果在造車專案上歷經波折並最終放棄,但在相當長的一段時間內,蘋果積極收集了大量相關專利。除了眾所周知的自動駕駛技術外,蘋果還探索了更為前沿的技術領域,如增強現實顯示導航;利用雷達生成周圍高分辨率資訊;估算道路表面摩擦系數的方法;根據交警手勢判斷交通狀況以及車輛自主接入電源等。

讓器材透過傳感器了解使用者,透過深度學習演算法為使用者提供所需要的支持,這是蘋果對「人工智能」的理解。MR、空間計算是蘋果認為的科技發展大方向,也是蘋果對技術整合的最終階段,在「機器之心」對蘋果收購案例的整理中,也能印證這點。

措手不及的蘋果

蘋果公司歷來高度重視自身的品牌形象。自庫克執掌蘋果以來,始終堅持只將成熟的技術呈現給使用者,即便某項技術備受市場矚目,也不會輕易上馬。穩健的市場策略確保了蘋果在產品與生態構建方面保持著極高的專註度。

蘋果是相信人工智能的,只不過它是以收集數據和器材協同的方式來實作這一點。而生成式AI的出現似乎不在蘋果的理解範圍之內,目前來看,當AI能夠理解語言後,其學習能力已經不能以對待機器人的眼光去看了。

從蘋果近期的行動來看,似乎也沒有坐以待斃,據市場調研機構Stocklytics最新報告披露,截止2023年,蘋果總共收購了32家AI公司,是科技公司中收購數量最多的。現在的蘋果似乎既怕趕不上AI大模型的熱潮,又怕在發展過程中壓錯註。

媒體報道下的蘋果AI同樣撲朔迷離,今年初,蘋果被曝光已經開始研發AI大模型,代號為Ajax,蘋果內部稱之為Apple GPT,擁有2000億參數的Apple GPT可能與OpenAI最新的大模型效能相當。

但近日,在網站arXiv中,蘋果上新了一篇名為【 MM1 : Methods , Analysis & Insights from Multimodal LLM Pre-training 】的論文,其中他們公布了名為MM1 的基礎大模型,其中最大規模的只有300億參數。相比之下,谷歌PaLM大模型擁有5400億參數,OpenAI的GPT-4更是被猜測擁有1.7萬億參數。

甚至據知名蘋果爆料人Mark Gurman稱,蘋果正在和谷歌洽談「將谷歌Gemini Nano植入iPhone事宜」,谷歌Gemini Nano也是三星手機使用的端側大模型。

目前外界對蘋果大模型的說法層出不窮,在官方沒有公布之前,很難斷定蘋果最後會以什麽方式入局。我們認為,蘋果在大模型布局上的進度相對緩慢主要是以下兩點原因:

1.大模型to C套用場景的空白。

包括Chat-GPT在內,大部份生成式AI大模型仍圍繞著網頁對話方塊,對於普通使用者來說,本質上還是一個更「智能」的私人助理或聊天機器人,如果大模型的作用只是給Siri升個級,蘋果無需大費周章。

與其他巨頭不同,蘋果是更面向使用者的科技公司。儲備相關技術,並尋找將其轉化為優質使用者體驗的切入點,這才是蘋果一貫的產品思路。

2. 難以權衡使用者私密性。

Siri專案不止一次引發過使用者對私密問題的擔憂,而大模型的訓練更會如此,蘋果作為一家特別強調使用者私密安全性的科技公司,自然要將生成式AI大模型的套用建立在保護使用者私密的前提下。

蘋果與OpenAI等公司的差異在於,蘋果的AI大模型旨在服務全球22億台蘋果器材的使用者,自然要針對性地收集使用者資訊並進行個人化訓練。蘋果要考慮拿出一個什麽樣的私密解決方案,目前最好的方法就是放入一個端側的本地大模型,但這是否能帶來突破性的體驗還尚未可知。

對大模型套用場景的一些預測

首先,我們認為生成式AI大模型的核心優勢在於打造各行業的「超級工具」, 類似於Sora在影視行業中所展現出的深遠影響力。經過對每個行業內容的深度訓練,大模型能夠顯著提供精準、高效的解決方案,從而成為推動行業發展的強大引擎。

其次,大模型對於To C場景而言,可想像的空間十分豐富,無論是為使用者提供多元化的教育資源,還是進行精準的金融分析,或是實作個人情緒疏導,大模型都能依托其龐大的數據庫進行個人化訓練,但實作這些功能最大障礙依然是私密安全問題。

蘋果並非完全不在使用者手機中收集數據,實際上,蘋果使用者可以透過存取「iPhone-私密與安全性-分析數據」來檢視被收集的大量數據。然而,蘋果采用了差分私密演算法,確保即便在收集數據的過程中,蘋果也無法確定這些數據具體來自哪部手機。目前,該演算法主要收集硬件和效能統計等資訊。

因此,我們期待蘋果能夠妥善解決大模型訓練與私密保護之間的矛盾,進而為使用者構建一個功能全面的AI助理,或AI分身,協助使用者高效處理工作、生活事務。同時,也存在蘋果憑借其M系列處理器開創全新AI領域的可能性,從而成為一家融合使用者、軟件、硬件於一體的綜合性AI公司。

目前市場中盡管已有眾多手機套用了AI大模型技術,但尚未有能夠撼動iPhone市場領導地位的產品出現。iPhone在華銷售額的下跌,並非完全歸咎於AI技術方面的欠缺。因此,從蘋果積極收購大量AI公司,並將其巨額投入的造車團隊轉移至AI專案等舉措來看,蘋果顯然已經明確了自己的AI發展策略與方向。

接下來,人工智能領域能否迎來 「iPhone時刻」,或者這僅僅是蘋果公司在面臨困境時的倉促之舉,預計在今年6月的WWDC中,我們就能夠窺見一二。