當前位置: 華文世界 > 手機

AI手機的較量:除了端側大模型,還有什麽在決定手機廠商的未來?

2024-06-04手機

AIGC是未來決定手機廠商座次的關鍵,其中端側大模型無疑是勝負手之一。

蘋果在放棄造車後,密集釋出了與端側大模型相關的研究成果;忙於「國產替代」的華為,則收購了面壁智能,該初創企業在今年4月釋出的端側模型系列「MiniCPM-V 2.0」,在同等效能參數更小、同等參數效能更強,超越Mistral-7B、Llama2-13B、 ChatGLM3-6B等模型;三星、榮耀、OPPO、vivo等手機廠商,則推出了搭載有端側大模型的AI手機……

當前的AI手機,能夠在離線狀態下使用AI消除路人、即時雙向轉譯等功能,如榮耀的AI手機還能辨識使用者意圖,為其提供相關套用/服務。IDC預測,中國AI手機的市場份額在2026年將很快飆升至45.3%。

由於執行端側大模型會大幅增加手機的工作負荷,因此在落地過程中手機廠商也正迎來許多挑戰,比如如何將更大參數的模型塞進手機,或者令小參數規模的模型實作比肩大參數規模模型的效能。

對於誌在躋身世界一流的本土廠商及產業鏈上眾多的供應鏈企業而言,AI浪潮無疑是千載難逢的機遇。

來源:新財富雜誌(ID:xcfplus)

作者:張天倫

2023年四季度起,許多手機大廠釋出了搭載有AI功能的手機,其中不少實用的創新功能頗為抓人眼球。

例如,小米、OPPO、vivo等廠商新釋出的旗艦機型,能夠在離線狀態下使用「AI去除路人」功能,過去該功能需在「美圖秀秀」等App中付費使用,售價為30元/月,且需連線網絡。海外市場,三星AI手機「Galaxy S24」新增的雙向通話轉譯功能,則能夠即時轉譯13種異國語言,讓通話雙方聽到轉譯後的語音及文字,讓使用者跨越語言障礙(表1)。

消費者也願意為之埋單。最為亮眼的「Xiaomi 14系列」,首周銷量即突破百萬台,「這個成績應該是除iPhone外,近幾年國產手機全價位段銷量的最高峰。」Redmi市場總經理、Redmi品牌發言人王騰稱。在南韓,「Galaxy S24」用時28天突破百萬銷量的成績,也創下S系列機型的銷售記錄。

在AI手機搶占使用者心智前,手機大廠已在用更快的速度加碼AI布局。 本土廠商中,OPPO成立了AI中心,整合全球資源向AI集中;小米AI團隊人員規模已達3000多人,並在2023年4月組建了超1200人的AI大模型團隊;vivo組建了千人規模的AI專家團隊,並在2018年成立了人工智能圖譜研究院;榮耀釋出了AI使能全場景戰略,並表示任何手機作業系統都值得用AI重做一遍;中興、魅族等蟄伏於二三線的廠商,則發出了「All in AI」「All for AI」的宣告……IDC預測,中國AI手機的市場份額在2026年將很快飆升至45.3%。

海外市場,蘋果在今年2月被爆放棄了已投入10年時間、耗費數十億美元的汽車專案之後,開始大幅追加生成式人工智能(AI-Generated Content,簡稱「AIGC」)領域投入。在第二季度的財報電話會議上,蘋果CEO庫克預測公司在AIGC領域將超越競爭對手,並有望引領行業標準。

AIGC在邏輯推理、語言理解、長文本等方面出眾的能力有目共睹,也正在為創新乏力的手機廠商提供新的升級方向。 「2024年是AI手機元年。AI手機也將成為繼功能機、智能電話之後,手機行業的第三階段。這輪由大模型支撐的AI技術,正在重構手機行業的未來。」龍年伊始,OPPO創始人兼CEO陳永明在公開信中作出最新表態。

那麽,為了不被AI浪潮擠下牌桌,各大廠商究竟如何布局?所謂的AI手機,究竟關聯著哪些核心技術?

01

端側大模型圖景:蘋果陸續披露成果,華為投資初創企業

隨著Kimi、文心一言等App/小程式的推出,當前大部份的智能機使用者都能夠體驗到前沿的AI功能。那麽,AI手機與智能機相比,又有何不同?

根據市面上已釋出的AI手機看,其一大特征,是在斷網狀態下依舊能夠提供AI服務,包括路人消除、即時雙向轉譯、通話摘要等。 而做到這一步的核心,在於端側大模型。

所謂端側大模型,指能夠在終端器材,比如手機上執行的AI大模型,其主要依賴終端原生的芯片等硬件提供算力和演算法,實作一系列的AIGC能力。

同時,端側大模型也是手機AI能力可持續的重要一環。 當前使用者在美圖秀秀、Kimi、文心一言等App/小程式使用AI功能時,算力主要由雲端伺服器提供,成本極高。相比較下,使用者透過AI手機搭載的端側大模型使用AI消除等功能,成本只是手機功耗提升,耗電量增加。

「現在套用一次雲端大模型的成本大概在1.2-1.5分左右,若vivo國內3億使用者每天用十次,一年算下來也有百億元左右的支出。」vivo副總裁周圍曾透露。

而端側大模型的能力也遠不僅是將AI消除、即時雙向轉譯等AI功能塞進手機,手機廠商當前的另一趨勢,是將端側大模型的算力融入至作業系統,讓手機成為一個能夠管理使用者各類數據,辨識使用者需求並提供服務的AI智能體(簡稱「AI-Agent」)。「我們認為任何手機作業系統都值得用AI重做一遍。」榮耀CEO趙明稱。

基於此,端側大模型引起了手機廠商的高度重視,紛紛在此領域加緊研發及布局。

據新財富統計,目前市面上AI手機所搭載的端側大模型,大部份為各廠商自研(表2)。 當然也有特例,如三星Galaxy S24系列,在海外市場主要采用谷歌的「Gemini Nano」,而在中國內地則由百度的「文心大模型」提供端側AI能力。但隨著三星於2023年11月公布了自研大模型「Gauss」,未來,其手機產品搭載的端側大模型是否會轉向「Gauss」,也是未知數。

提出要用AI重做作業系統的榮耀,正將自研的「魔法大模型」整合到其作業系統Magic OS和所有榮耀器材中,並在2024年1月釋出了全新的Magic OS 8.0,以及Magic 6手機。

Magic OS 8.0與舊版的最大區別,在於能夠精準辨識使用者意圖,預測並推薦使用者所需的服務。以Magic 6新增的「任意門」功能為例,當使用者需要導航微信聊天時所提及的地點,只需長按相關資訊,拖至左右兩側螢幕喚醒「任意門」,作業系統即能辨識使用者的導航需求,匹配常用的導航App,實作地址一拖立即導航。此外,其語言助手YOYO,也整合了「個人事務助理」「圖庫語意搜尋」「對話成片」等AI功能,。

蘋果盡管尚未推出AI手機,但自戰略轉向後,也密集釋出了多個與端側大模型相關的研究成果,包括可顯著提升Siri在理解和響應使用者指令方面能力的端側大模型「ReALM」,該模型參數包括0.8億、2.5億、10億、30億四大規模,其中,僅0.8億參數的模型,即能在上下文理解能力上打平甚至超越GPT-4;可針對移動使用者介面理解與互動的端側大模型「Ferret-UI」,其在理解應用程式在螢幕上顯示的內容時有著顯著的優勢;在端側獨立執行的開源系列模型「Open ELM」,其包含2.7億、4.5億、11億和30億共四個不同參數版本,提供生成文本、程式碼、轉譯、總結摘要等功能……不難看出其正將端側大模型植入進自身的生態系之中。

除了積極自研之外,蘋果還在3月收購了加拿大一家初創生成式AI公司Darwin AI,該公司的核心技術之一是利用機器學習構建更小、更高效的AI系統。

在國內,小米、華為也正透過投資,加速大模型布局。 其中,小米分別在2023年8月、10月先後參與了北京智譜華章科技有限公司(簡稱「智譜AI」)、北京百川智能科技有限公司(簡稱「百川智能」)的B+輪、A輪融資。

在矽谷科技媒體The Information對中國大模型企業的盤點中,智譜AI被認為是「最有可能成為‘中國OpenAI’的5家企業」之一,其余4家分別為MiniMax、光年之外、瀾舟科技、月之暗面。

2024年1月16日,智譜AI釋出了全新自研的第四代多模態基座大模型GLM-4系列,稱效能相比上一代全面提升接近60%、模型效能直接逼近GPT-4,OPPO、華為也出現在其合作夥伴名單中。

華為在今年4月透過深圳哈伯科技投資合夥企業(有限合夥)(簡稱「哈伯科技」)投資了一家大模型初創企業北京面壁智能科技有限責任公司(簡稱「面壁智能」),其曾在2月釋出了適配於主流手機的端側大模型「MiniCPM」。面壁智能成立於2022年8月,其CEO李大海為現知乎技術總監,從零開始為知乎搭建搜尋和推薦業務,是知乎AI「智能社區」發起人。清華大學電腦系長聘副教授劉知遠是面壁智能的聯合創始人兼首席科學家,主要研究方向為自然語言處理、知識圖譜和社會計算。

企查查顯示,2023年4月,面壁科技完成天使輪融資,投資方為知乎以及智譜AI。2024年,哈伯科技領投面壁智能B輪融資,參投方包括北京市人工智能產業投資基金(有限合夥)、春華資本、知乎。

02

產業鏈洗牌在即

當端側大模型加速落地,手機廠商將面臨更多技術挑戰。

需要解釋的是,依據模型的規模定律,參數規模是決定模型效能的最關鍵因素,即參數越高,效能越強。 以vivo釋出的「藍心大模型」為例,其70億參數的模型,具備較強的語言理解和文本創作能力,而10億參數級別的模型,則主要負責專業文本處理相關的工作。

但由於執行端側大模型會大幅增加手機的工作負荷,因此如何將更大參數的模型塞進手機,或者令小參數規模的模型實作比肩大參數規模模型的效能,均是手機廠商尚需解決的問題。

例如,2023年10月谷歌釋出旗艦手機Pixel 8和Pixel 8 Pro時,即以「硬件限制」為理由,拒絕在Pixel 8上執行最新的大模型「Gemini Nano」,使用者只能在隱藏的開發者選項中開啟。「Pixel 8只有8GB記憶體,如果貿然啟用‘Gemini Nano’功能,很可能會影響使用者的使用體驗。與之相反,Pixel 8 Pro擁有12GB記憶體,能比較好地釋放AI模型效能。」谷歌器材和服務軟件副總裁Seang Chau解釋稱。

彼時,谷歌Pixel 8 Pro搭載的端側大模型「Gemini」,參數規模分別為18億、32.5億。而到了2024年,除vivo外,OPPO、榮耀也同樣將70億參數的端側大模型裝進手機。

以OPPO為例,為了將更高規模參數的大模型塞進手機,其做了不少技術攻關。其一是記憶體壓縮,透過對模型進行高精度4bit量化、蒸餾、剪枝的壓縮處理,同時針對關鍵的套用場景做精調和預訓練,在保留精度的同時減少損耗,最終讓70億參數大模型所占用的執行記憶體壓縮至最小的3.9GB左右。「70億大模型正常的大小是28GB。」OPPO軟件創新中心總經理張峻曾表示。

OPPO推出的Find X7系列,執行記憶體分為12GB、16GB。可以參考的是,當前主流手機的執行記憶體在6GB-12GB之間,在沒有大模型之前足以支持智能機的流暢執行。

其二,OPPO還自研了推理引擎AI Boost和Transformer加速庫,最佳化記憶體管理,使功耗降低一半。同時與芯片廠商合作,透過平行計算的算子最佳化,降低時延。

值得一提的是,Find X7系列搭載的芯片是聯發科的「天璣9300」。聯發科在該芯片釋出會上曾表示,結合其特有的記憶體硬件壓縮技術等,可大幅減少AI大模型對終端記憶體的占用,最高可支持執行330億參數的AI模型。

除OPPO外,小米也透過最佳化「AI路人消除」「AI擴圖」等功能對手機記憶體的要求,將相關功能覆蓋至「Xiaomi 13」等僅有8GB記憶體的手機中。

榮耀在2023年9月建立了生態聯合創新實驗室,其中一個目的即是與高通深度合作加速端部署AI大模型。值得一提的是,憑借NPU(Neural Network Processing Unit,神經網絡處理器)和異構計算解決方案,高通的「驍龍8 Gen 3」芯片同樣支持百億級端側大模型執行。

蘋果在芯片領域的表現也不容忽視。 2024年5月,蘋果釋出了搭載於平板、電腦上的最新一代PC芯片「M4」。據悉,該芯片整合了蘋果專門用於加速AI任務的NPU,其運算速度最高可達每秒38萬億次,相比A11仿生芯片中的初代神經網絡引擎,提速最高可達60倍。搭載了「M4」芯片的iPad,能夠更好勝任AI任務處理,比如將4K影片中的目標物件從背景中分離出來、在彈鋼琴時用Staff Pad即時自動建立樂譜。「沒有M4就沒有新iPad Pro。」蘋果硬件工程高級副總裁John Ternus表示。

值得一提的是,將於今年下半年釋出的新一代iPhone,料將搭載整合了該NPU的全新A系列芯片,結合已披露的各項端側大模型成果,或許在軟、硬件領域的全面布局,是庫克對蘋果在AIGC領域保持領先的信心源泉。

除了搭載更高規格的芯片、儲存,加強適配及最佳化之外,為了將AI功能向中低端手機滲透,提升小參數模型的效能也是重要路徑。

例如面壁智能在4月釋出的端側模型系列「MiniCPM-V 2.0」,在同等效能參數更小、同等參數效能更強,超越Mistral-7B、Llama2-13B、 ChatGLM3-6B等模型。此外,面壁科技同時釋出的「 MiniCPM-1.2B」,在參數減半的情況下,效能能夠達到28億參數版本的87%。

據悉,商湯(00020.HK)在4月23日舉行的釋出會上推出的18億參數規模的「SenseChat-Lite」端側⼤模型,在基準測試中,全面超越了MiniCPM-V 2.0、Phi-2等所有開源的同量級的大模型,甚至越級比肩一些70億、130億規模的大模型。同時,該模型也廣泛適配至手機、電腦、VR、車載顯示器等多種硬件場景,以及包括高通、聯發科等廠商的多款芯片。

釋出會次日,商湯股價上漲31.15%,在7個交易日間的漲幅更是超過160%。

中金公司還指出,除智能終端、芯片、儲存等企業外,端側大模型也對散熱、電池及整機設計等提出了更高要求,升級路徑包括研發矽碳負極提升電池能量密度,透過石墨烯等新材料提升散熱能力等。「在AI時代,隨著算力提升帶來的功耗提升,對電池續航能力的要求也更高。由於芯片算力提升,對應對散熱的要求也會提升,但同時還要滿足手機在重量、厚度等方面的整體設計要求,因此目前各家廠商的散熱方案並不完全一致,但透過提升散熱能力降低發熱的整體思路一致。」

不難看出,AI時代,不僅是手機廠商,整個供應鏈的企業也都將會迎來一次洗牌機會。

03

端雲協同,巨頭共同金塊AI市場

盡管各廠商AI手機之間的差異化主要來自於端側大模型與作業系統的融合及創新,但這並不妨礙雲側大模型的地位。

原因在於,雲側大模型擅長處理復雜問題的能力,能夠滿足使用者在金融、購物、知識問答等領域的深層次需求。因此,端側大模型與雲側大模型互為補充,「端雲協同」也成為AI手機最佳的解決方案。

具體操作上,榮耀宣布與百度智能雲進行合作,並釋出了「百模生態計劃」,讓雲側通用大模型和各種行業垂域大模型可以透過貨架化方式融入到 Magic OS中;OPPO、vivo在自研端側大模型的同時,也釋出了自研的雲側大模型;蘋果則被爆出正與Open AI和谷歌接觸,探索合作可能。

值得一提的是,中興努比亞系列手機的智慧轉譯、聊天對話、創意寫作等AI功能,全部由雲側大模型提供。但中興通訊高級副總裁、終端事業部總裁倪飛也表示,公司未來也會推進端側模型。「這與主流手機廠商‘端雲協同’的模式基本相同,可以有效平衡雲端算力成本過高的問題,同時保護使用者私密。」他表示。

盡管當前手機在雲側的AI功能均不收費,但未來不排除付費可能。 在Galaxy S24系列的介紹頁面上,三星曾標註了Galaxy AI功能於2025年底免費提供給支持該功能的器材。三星方面則回應稱:「目前沒有2025年之後的計劃,但不排除未來三星可能將其部份或全部AI功能變更為有償服務。」結合公開資料,三星如「即圈即搜」等功能即整合了京東、百度、美團等多個第三方雲側大模型,由此產生的費用未來也不排除由模型供應商承擔。

但毋庸置疑的是,手機是大模型商業變現價值最高的終端器材,未來其中也會有更多的商業模式創新。

過去十年,基於開放的安卓生態,以及對供應鏈的整合能力,小米、華為、OPPO、vivo、榮耀等本土廠商取代諾基亞、摩托羅拉、黑莓等舊勢力,登上世界舞台。

根據IDC數據,2023年全球手機出貨量排名前5的手機廠中,小米、OPPO、傳音三大本土廠商分列第3-5名,合計份額達29.4%。此外,包括榮耀、華為、vivo等手機大廠,也占據著不低的市場份額。

如今的AI浪潮,對於誌在躋身世界一流的本土廠商及產業鏈上眾多的供應鏈企業而言,無疑是千載難逢的機遇。

- END -

本文所提及的任何資訊和資訊,僅為作者個人觀點表達或對於具體事件的陳述,不構成推薦及投資建議。投資者應自行承擔據此進行投資所產生的風險及後果。