当前位置: 华文世界 > 手机

AI手机的较量:除了端侧大模型,还有什么在决定手机厂商的未来?

2024-06-04手机

AIGC是未来决定手机厂商座次的关键,其中端侧大模型无疑是胜负手之一。

苹果在放弃造车后,密集发布了与端侧大模型相关的研究成果;忙于「国产替代」的华为,则收购了面壁智能,该初创企业在今年4月发布的端侧模型系列「MiniCPM-V 2.0」,在同等性能参数更小、同等参数性能更强,超越Mistral-7B、Llama2-13B、 ChatGLM3-6B等模型;三星、荣耀、OPPO、vivo等手机厂商,则推出了搭载有端侧大模型的AI手机……

当前的AI手机,能够在离线状态下使用AI消除路人、实时双向翻译等功能,如荣耀的AI手机还能识别用户意图,为其提供相关应用/服务。IDC预测,中国AI手机的市场份额在2026年将很快飙升至45.3%。

由于运行端侧大模型会大幅增加手机的工作负荷,因此在落地过程中手机厂商也正迎来许多挑战,比如如何将更大参数的模型塞进手机,或者令小参数规模的模型实现比肩大参数规模模型的性能。

对于志在跻身世界一流的本土厂商及产业链上众多的供应链企业而言,AI浪潮无疑是千载难逢的机遇。

来源:新财富杂志(ID:xcfplus)

作者:张天伦

2023年四季度起,许多手机大厂发布了搭载有AI功能的手机,其中不少实用的创新功能颇为抓人眼球。

例如,小米、OPPO、vivo等厂商新发布的旗舰机型,能够在离线状态下使用「AI去除路人」功能,过去该功能需在「美图秀秀」等App中付费使用,售价为30元/月,且需连接网络。海外市场,三星AI手机「Galaxy S24」新增的双向通话翻译功能,则能够即时翻译13种异国语言,让通话双方听到翻译后的语音及文字,让用户跨越语言障碍(表1)。

消费者也愿意为之埋单。最为亮眼的「Xiaomi 14系列」,首周销量即突破百万台,「这个成绩应该是除iPhone外,近几年国产手机全价位段销量的最高峰。」Redmi市场总经理、Redmi品牌发言人王腾称。在韩国,「Galaxy S24」用时28天突破百万销量的成绩,也创下S系列机型的销售记录。

在AI手机抢占用户心智前,手机大厂已在用更快的速度加码AI布局。 本土厂商中,OPPO成立了AI中心,整合全球资源向AI集中;小米AI团队人员规模已达3000多人,并在2023年4月组建了超1200人的AI大模型团队;vivo组建了千人规模的AI专家团队,并在2018年成立了人工智能图谱研究院;荣耀发布了AI使能全场景战略,并表示任何手机操作系统都值得用AI重做一遍;中兴、魅族等蛰伏于二三线的厂商,则发出了「All in AI」「All for AI」的宣告……IDC预测,中国AI手机的市场份额在2026年将很快飙升至45.3%。

海外市场,苹果在今年2月被爆放弃了已投入10年时间、耗费数十亿美元的汽车项目之后,开始大幅追加生成式人工智能(AI-Generated Content,简称「AIGC」)领域投入。在第二季度的财报电话会议上,苹果CEO库克预测公司在AIGC领域将超越竞争对手,并有望引领行业标准。

AIGC在逻辑推理、语言理解、长文本等方面出众的能力有目共睹,也正在为创新乏力的手机厂商提供新的升级方向。 「2024年是AI手机元年。AI手机也将成为继功能机、智能手机之后,手机行业的第三阶段。这轮由大模型支撑的AI技术,正在重构手机行业的未来。」龙年伊始,OPPO创始人兼CEO陈永明在公开信中作出最新表态。

那么,为了不被AI浪潮挤下牌桌,各大厂商究竟如何布局?所谓的AI手机,究竟关联着哪些核心技术?

01

端侧大模型图景:苹果陆续披露成果,华为投资初创企业

随着Kimi、文心一言等App/小程序的推出,当前大部分的智能机用户都能够体验到前沿的AI功能。那么,AI手机与智能机相比,又有何不同?

根据市面上已发布的AI手机看,其一大特征,是在断网状态下依旧能够提供AI服务,包括路人消除、实时双向翻译、通话摘要等。 而做到这一步的核心,在于端侧大模型。

所谓端侧大模型,指能够在终端设备,比如手机上运行的AI大模型,其主要依赖终端本地的芯片等硬件提供算力和算法,实现一系列的AIGC能力。

同时,端侧大模型也是手机AI能力可持续的重要一环。 当前用户在美图秀秀、Kimi、文心一言等App/小程序使用AI功能时,算力主要由云端服务器提供,成本极高。相比较下,用户通过AI手机搭载的端侧大模型使用AI消除等功能,成本只是手机功耗提升,耗电量增加。

「现在应用一次云端大模型的成本大概在1.2-1.5分左右,若vivo国内3亿用户每天用十次,一年算下来也有百亿元左右的支出。」vivo副总裁周围曾透露。

而端侧大模型的能力也远不仅是将AI消除、实时双向翻译等AI功能塞进手机,手机厂商当前的另一趋势,是将端侧大模型的算力融入至操作系统,让手机成为一个能够管理用户各类数据,识别用户需求并提供服务的AI智能体(简称「AI-Agent」)。「我们认为任何手机操作系统都值得用AI重做一遍。」荣耀CEO赵明称。

基于此,端侧大模型引起了手机厂商的高度重视,纷纷在此领域加紧研发及布局。

据新财富统计,目前市面上AI手机所搭载的端侧大模型,大部分为各厂商自研(表2)。 当然也有特例,如三星Galaxy S24系列,在海外市场主要采用谷歌的「Gemini Nano」,而在中国内地则由百度的「文心大模型」提供端侧AI能力。但随着三星于2023年11月公布了自研大模型「Gauss」,未来,其手机产品搭载的端侧大模型是否会转向「Gauss」,也是未知数。

提出要用AI重做操作系统的荣耀,正将自研的「魔法大模型」整合到其操作系统Magic OS和所有荣耀设备中,并在2024年1月发布了全新的Magic OS 8.0,以及Magic 6手机。

Magic OS 8.0与旧版的最大区别,在于能够精准识别用户意图,预测并推荐用户所需的服务。以Magic 6新增的「任意门」功能为例,当用户需要导航微信聊天时所提及的地点,只需长按相关信息,拖至左右两侧屏幕唤醒「任意门」,操作系统即能识别用户的导航需求,匹配常用的导航App,实现地址一拖立即导航。此外,其语言助手YOYO,也集成了「个人事务助理」「图库语义搜索」「对话成片」等AI功能,。

苹果尽管尚未推出AI手机,但自战略转向后,也密集发布了多个与端侧大模型相关的研究成果,包括可显著提升Siri在理解和响应用户指令方面能力的端侧大模型「ReALM」,该模型参数包括0.8亿、2.5亿、10亿、30亿四大规模,其中,仅0.8亿参数的模型,即能在上下文理解能力上打平甚至超越GPT-4;可针对移动用户界面理解与交互的端侧大模型「Ferret-UI」,其在理解应用程序在屏幕上显示的内容时有着显著的优势;在端侧独立运行的开源系列模型「Open ELM」,其包含2.7亿、4.5亿、11亿和30亿共四个不同参数版本,提供生成文本、代码、翻译、总结摘要等功能……不难看出其正将端侧大模型植入进自身的生态系统之中。

除了积极自研之外,苹果还在3月收购了加拿大一家初创生成式AI公司Darwin AI,该公司的核心技术之一是利用机器学习构建更小、更高效的AI系统。

在国内,小米、华为也正通过投资,加速大模型布局。 其中,小米分别在2023年8月、10月先后参与了北京智谱华章科技有限公司(简称「智谱AI」)、北京百川智能科技有限公司(简称「百川智能」)的B+轮、A轮融资。

在硅谷科技媒体The Information对中国大模型企业的盘点中,智谱AI被认为是「最有可能成为‘中国OpenAI’的5家企业」之一,其余4家分别为MiniMax、光年之外、澜舟科技、月之暗面。

2024年1月16日,智谱AI发布了全新自研的第四代多模态基座大模型GLM-4系列,称性能相比上一代全面提升接近60%、模型性能直接逼近GPT-4,OPPO、华为也出现在其合作伙伴名单中。

华为在今年4月通过深圳哈勃科技投资合伙企业(有限合伙)(简称「哈勃科技」)投资了一家大模型初创企业北京面壁智能科技有限责任公司(简称「面壁智能」),其曾在2月发布了适配于主流手机的端侧大模型「MiniCPM」。面壁智能成立于2022年8月,其CEO李大海为现知乎技术总监,从零开始为知乎搭建搜索和推荐业务,是知乎AI「智能社区」发起人。清华大学计算机系长聘副教授刘知远是面壁智能的联合创始人兼首席科学家,主要研究方向为自然语言处理、知识图谱和社会计算。

企查查显示,2023年4月,面壁科技完成天使轮融资,投资方为知乎以及智谱AI。2024年,哈勃科技领投面壁智能B轮融资,参投方包括北京市人工智能产业投资基金(有限合伙)、春华资本、知乎。

02

产业链洗牌在即

当端侧大模型加速落地,手机厂商将面临更多技术挑战。

需要解释的是,依据模型的规模定律,参数规模是决定模型性能的最关键因素,即参数越高,性能越强。 以vivo发布的「蓝心大模型」为例,其70亿参数的模型,具备较强的语言理解和文本创作能力,而10亿参数级别的模型,则主要负责专业文本处理相关的工作。

但由于运行端侧大模型会大幅增加手机的工作负荷,因此如何将更大参数的模型塞进手机,或者令小参数规模的模型实现比肩大参数规模模型的性能,均是手机厂商尚需解决的问题。

例如,2023年10月谷歌发布旗舰手机Pixel 8和Pixel 8 Pro时,即以「硬件限制」为理由,拒绝在Pixel 8上运行最新的大模型「Gemini Nano」,用户只能在隐藏的开发者选项中开启。「Pixel 8只有8GB内存,如果贸然启用‘Gemini Nano’功能,很可能会影响用户的使用体验。与之相反,Pixel 8 Pro拥有12GB内存,能比较好地释放AI模型性能。」谷歌设备和服务软件副总裁Seang Chau解释称。

彼时,谷歌Pixel 8 Pro搭载的端侧大模型「Gemini」,参数规模分别为18亿、32.5亿。而到了2024年,除vivo外,OPPO、荣耀也同样将70亿参数的端侧大模型装进手机。

以OPPO为例,为了将更高规模参数的大模型塞进手机,其做了不少技术攻关。其一是内存压缩,通过对模型进行高精度4bit量化、蒸馏、剪枝的压缩处理,同时针对关键的应用场景做精调和预训练,在保留精度的同时减少损耗,最终让70亿参数大模型所占用的运行内存压缩至最小的3.9GB左右。「70亿大模型正常的大小是28GB。」OPPO软件创新中心总经理张峻曾表示。

OPPO推出的Find X7系列,运行内存分为12GB、16GB。可以参考的是,当前主流手机的运行内存在6GB-12GB之间,在没有大模型之前足以支持智能机的流畅运行。

其二,OPPO还自研了推理引擎AI Boost和Transformer加速库,优化内存管理,使功耗降低一半。同时与芯片厂商合作,通过并行计算的算子优化,降低时延。

值得一提的是,Find X7系列搭载的芯片是联发科的「天玑9300」。联发科在该芯片发布会上曾表示,结合其特有的内存硬件压缩技术等,可大幅减少AI大模型对终端内存的占用,最高可支持运行330亿参数的AI模型。

除OPPO外,小米也通过优化「AI路人消除」「AI扩图」等功能对手机内存的要求,将相关功能覆盖至「Xiaomi 13」等仅有8GB内存的手机中。

荣耀在2023年9月建立了生态联合创新实验室,其中一个目的即是与高通深度合作加速端部署AI大模型。值得一提的是,凭借NPU(Neural Network Processing Unit,神经网络处理器)和异构计算解决方案,高通的「骁龙8 Gen 3」芯片同样支持百亿级端侧大模型运行。

苹果在芯片领域的表现也不容忽视。 2024年5月,苹果发布了搭载于平板、电脑上的最新一代PC芯片「M4」。据悉,该芯片集成了苹果专门用于加速AI任务的NPU,其运算速度最高可达每秒38万亿次,相比A11仿生芯片中的初代神经网络引擎,提速最高可达60倍。搭载了「M4」芯片的iPad,能够更好胜任AI任务处理,比如将4K视频中的目标对象从背景中分离出来、在弹钢琴时用Staff Pad实时自动创建乐谱。「没有M4就没有新iPad Pro。」苹果硬件工程高级副总裁John Ternus表示。

值得一提的是,将于今年下半年发布的新一代iPhone,料将搭载集成了该NPU的全新A系列芯片,结合已披露的各项端侧大模型成果,或许在软、硬件领域的全面布局,是库克对苹果在AIGC领域保持领先的信心源泉。

除了搭载更高规格的芯片、存储,加强适配及优化之外,为了将AI功能向中低端手机渗透,提升小参数模型的性能也是重要路径。

例如面壁智能在4月发布的端侧模型系列「MiniCPM-V 2.0」,在同等性能参数更小、同等参数性能更强,超越Mistral-7B、Llama2-13B、 ChatGLM3-6B等模型。此外,面壁科技同时发布的「 MiniCPM-1.2B」,在参数减半的情况下,性能能够达到28亿参数版本的87%。

据悉,商汤(00020.HK)在4月23日举行的发布会上推出的18亿参数规模的「SenseChat-Lite」端侧⼤模型,在基准测试中,全面超越了MiniCPM-V 2.0、Phi-2等所有开源的同量级的大模型,甚至越级比肩一些70亿、130亿规模的大模型。同时,该模型也广泛适配至手机、电脑、VR、车载显示屏等多种硬件场景,以及包括高通、联发科等厂商的多款芯片。

发布会次日,商汤股价上涨31.15%,在7个交易日间的涨幅更是超过160%。

中金公司还指出,除智能终端、芯片、存储等企业外,端侧大模型也对散热、电池及整机设计等提出了更高要求,升级路径包括研发硅碳负极提升电池能量密度,通过石墨烯等新材料提升散热能力等。「在AI时代,随着算力提升带来的功耗提升,对电池续航能力的要求也更高。由于芯片算力提升,对应对散热的要求也会提升,但同时还要满足手机在重量、厚度等方面的整体设计要求,因此目前各家厂商的散热方案并不完全一致,但通过提升散热能力降低发热的整体思路一致。」

不难看出,AI时代,不仅是手机厂商,整个供应链的企业也都将会迎来一次洗牌机会。

03

端云协同,巨头共同掘金AI市场

尽管各厂商AI手机之间的差异化主要来自于端侧大模型与操作系统的融合及创新,但这并不妨碍云侧大模型的地位。

原因在于,云侧大模型擅长处理复杂问题的能力,能够满足用户在金融、购物、知识问答等领域的深层次需求。因此,端侧大模型与云侧大模型互为补充,「端云协同」也成为AI手机最佳的解决方案。

具体操作上,荣耀宣布与百度智能云进行合作,并发布了「百模生态计划」,让云侧通用大模型和各种行业垂域大模型可以通过货架化方式融入到 Magic OS中;OPPO、vivo在自研端侧大模型的同时,也发布了自研的云侧大模型;苹果则被爆出正与Open AI和谷歌接触,探索合作可能。

值得一提的是,中兴努比亚系列手机的智慧翻译、聊天对话、创意写作等AI功能,全部由云侧大模型提供。但中兴通讯高级副总裁、终端事业部总裁倪飞也表示,公司未来也会推进端侧模型。「这与主流手机厂商‘端云协同’的模式基本相同,可以有效平衡云端算力成本过高的问题,同时保护用户隐私。」他表示。

尽管当前手机在云侧的AI功能均不收费,但未来不排除付费可能。 在Galaxy S24系列的介绍页面上,三星曾标注了Galaxy AI功能于2025年底免费提供给支持该功能的设备。三星方面则回应称:「目前没有2025年之后的计划,但不排除未来三星可能将其部分或全部AI功能变更为有偿服务。」结合公开资料,三星如「即圈即搜」等功能即集成了京东、百度、美团等多个第三方云侧大模型,由此产生的费用未来也不排除由模型供应商承担。

但毋庸置疑的是,手机是大模型商业变现价值最高的终端设备,未来其中也会有更多的商业模式创新。

过去十年,基于开放的安卓生态,以及对供应链的整合能力,小米、华为、OPPO、vivo、荣耀等本土厂商取代诺基亚、摩托罗拉、黑莓等旧势力,登上世界舞台。

根据IDC数据,2023年全球手机出货量排名前5的手机厂中,小米、OPPO、传音三大本土厂商分列第3-5名,合计份额达29.4%。此外,包括荣耀、华为、vivo等手机大厂,也占据着不低的市场份额。

如今的AI浪潮,对于志在跻身世界一流的本土厂商及产业链上众多的供应链企业而言,无疑是千载难逢的机遇。

- END -

本文所提及的任何资讯和信息,仅为作者个人观点表达或对于具体事件的陈述,不构成推荐及投资建议。投资者应自行承担据此进行投资所产生的风险及后果。