当前位置: 华文世界 > 科技

终端AI分级标准落地,手机大模型「战火」烧到了智能体

2024-10-20科技
AI与操作系统的深度融合成为了过去一个月手机厂商对外火力的集中点,从苹果的「Apple Intelligence」到荣耀的「AI智能体」、再从vivo的「PhoneGPT」到OPPO的「AIOS」,AI Agent智能体的竞争开始成为衡量手机厂商技术能力的关键所在。
在AI手机「大乱斗」的同时,相关的分级讨论也在进行。中国信息通信研究院(以下简称「信通院」)10月18日联合荣耀、vivo、华为等多家终端以及芯片公司发布全球首份【终端智能化分级研究报告】,对AI手机的进化路径给出明确方向。
「真假AI」手机至此有了评判的标准。Canalys分析师钟晓磊对第一财经记者表示,现象级的AI原生应用仍有待出现,如果AI原生应用能重新塑造移动互联网内容消费的现有习惯,那么对于端侧性能需求有望加速旧设备的淘汰。
分级标准落地
在互联网厂商仍在讨论谁是「中国版ChatGPT」时候,手机厂商以及终端产业链玩家也在寻找大模型为产业带来的新机会,试图从中分得一杯羹。但当声量聚集时,杂音以及复杂的话术使得「AI手机」成为了一个广泛且模糊的概念。
「能够提供生成式AI能力的手机并不等于AI手机,甚至相去甚远。」一位头部国产手机厂商负责人此前对记者表示,做AI手机想像快餐一样,反倒会适得其反。
什么是AI手机?如何定义AI手机的能力?能消图的就是AI手机了吗?面对这些问题,中国信息通信研究院在最新发布的报告中提到,终端智能化水平目前分为L1-L5五个等级,不同等级对应人、终端不同的角色定位,智能化等级越高,终端在任务完成过程中的自主参与度越高,人的参与度越低。
换言之,拥有上述分级能力的某种程度上可以称为具有AI能力的终端产品,但之间的能力差异非常大。
以出行场景为例,在L1级别中,用户输入信息「帮我预订一张北京到上海的机票」,终端可识别并执行指令,打开订票软件并输入相应内容,但需要用户自行浏览搜索结果,选择合适航班,填写乘客信息后自己完成支付。而到了L2,终端可以根据用户偏好打开订票软件自动搜索机票,L3场景中,更是能提供制定方案。L4场景则会根据用户的日常浏览动作识别出潜在的旅游需求并指定方案。到了L5级别,在没有订票动作的情况下,可以根据用户的日常信息推测出旅游的想法,并规划目的地以及方案。
可以看到,L1级(智能响应级)和L2级(智能辅助级)具备一定的智能化,可以基于用户偏好完成单类型任务。到了L3级(智能助理级)以及L4(智能协同级),则逐步从感知识别复杂意图到识别潜在意图。而L5级(自主智能级)则具备全面的智能化,基于全场景进行自主规划完成全类型任务。
但从L1到L5无疑是一项复杂的系统工程,需要产业各方协同合作、优势互补,共同推动终端智能化水平提升。而从目前手机厂商布局的方向来看,各有侧重点。
今年9月,荣耀在IFA展上正式发布了全球首个跨应用开放生态智能体「荣耀AI智能体」,基于对用户习惯的了解以及当前使用情景,可以理解用户需求并迅速作出响应,执行、调取手机各类资源与三方服务。
荣耀CEO赵明表示,荣耀AI智能体瞄向的是「手机自动驾驶」,AI Agent不仅能调用自家系统自带的服务,还面向所有第三方服务开放合作,荣耀要做的是「平台级」的AI终端。
OPPO也在近日的开发者大会上展示了AI搜索的能力。OPPO软件工程事业部总裁唐凯表示,AIOS将经历三个阶段,从系统应用AI化到系统AI化,再到AI即系统。换言之,OPPO寻求的是先从底层系统与AI的相融合,技术侧更偏向于自身系统的提升。
vivo的方向与OPPO类似。vivo AI全球研究院院长周围对记者表示,今年的核心是AI重构系统体验,不会局限在某个单一功能或者应用上,但具体会用什么样的方案,还在摸索。
苹果在此前也展示了AI手机的功能,比如与苹果语音助手Siri的结合,但从与OpenAI等大模型公司的合作看,苹果在AI上的方向也倾向于做平台方。
「战火」烧到了应用层
无论采取什么样的路径,AI在应用层面的真正竞争已经开始。在完成了算力、大模型基础构建的思考后,手机厂商中谁能更快地从L1走向L5,将决定未来在手机行业的身位。
具体来看,目前苹果的AI功能主要集中在主流应用中,从相机、相册、日历、备忘录,到浏览器、电子邮件,系统中几乎所有原生应用都将被AI赋能。此外,在苹果智能的加持下,苹果语音助手Siri的表现显著增强,并且用户在使用Siri和一系列应用期间,可以要求系统调用ChatGPT来进行回应。
与苹果相比,国内手机厂商则开始给出了更加具体的AI手机应用场景。
不久前,荣耀陆续公布了「一句话点外卖」「一句话转发文档」等AI功能。以「一句话转发文档」为例,用户向手机发出语音指令,与手机系统融合的荣耀AI智能体在理解用户需求后,按照「搜索、选择、分享」的步骤发送文件,支持跳转至微信App并选择对应联系人。
「AI智能体不仅能够听懂你的语义,关键是它可以理解屏幕上实时反馈的信息,并模仿人的理解来进行相应操作。」赵明表示,更为复杂的AI手机可以在第三方应用内模仿人来认知、理解应用的内容,并且模仿人来进行相应的操作。
OPPO则在开发者大会上推出了SenseNow框架,通过小布助手支持连续对话、景点识别。OPPO称,场景方向上,目标是让AI实现「听得清、看得懂、做得快」多模态直觉交互,从而理解用户的复杂意图,完成跨应用的操作,
vivo则将更多的能力下放至「小模型」上,比如图像模型、声音模型。
比起什么都做,周围认为需要基于现有的场景做AI能力叠加才有发展的可能。「比如说我们今年做了11种模型,第一版做了20多种语言,明年40种,后年可能是60种、80种,80种语言只要一个模型就可以搞定,当这种东西越来越多的时候,这个时候的手机就会出现体验上的差距。」周围说。
提起和苹果AI在应用层的差别,赵明认为,目前国内手机厂商的操作系统已经具备了更强大的能力。「厂商过去需要跟着安卓的节奏走,但现在安卓承担的更像是内核或者框架的作用。现在各家厂商都在系统层面投入,探索场景化的具体落地方案。在AI加持之后操作系统走向个人化,其实就是设备的千人千面。」
Counterpoint Research智能手机行业分析师Archie对记者表示,手机原来只是个工具,但在未来会变成了一个外脑,不再只是一个硬件状态。
Archie认为,应用场景探索中,多模态的输入和输出能力相结合,可以极大强化智能手机的生产力工具属性,既可以基于多种形式的输入信息,生成用户需要的图表、文本、音乐、图片甚至是视频,也可以对输入的图片、视频进行编辑,这些新的技术变革能够逐步激发消费市场新的需求。
但也可以看到,硬件层面的AI芯片推理能力以及软件层面的交互方式都对AI手机本身提出了更高的要求,成本和技术方案都来到了关键节点,而除了硬件外,各大手机厂商还需要围绕如何利用AI为用户提供个性化的服务展开。
(本文来自第一财经)