当前位置: 华文世界 > 手机

惊!华为、小米这次的大瓜,炸飞了我的三观!

2023-12-13手机

把AI大模型塞进手机系统里!手机:不好!不好!我竟然要长「脑子」了!

12月6日,全球科技巨头Google(谷歌),发布了号称「史上最强大」的原生多模态大模型——Gemini(双子座)。

划一个重点,Gemini能看、能听、能说、能写。 这综合实力,ChatGPT-4看了,都得「躺」在被窝里边瑟瑟发抖。

Gemini识别图像实时配文,图片源自Gemini官方

值得一提的是,Gemini 的中杯版本——Gemini Nano大模型,还将下放到手机终端应用上。也就是说,在谷歌新机Pixel 8 Pro上,就能体验到Gemini Nano。

手机大模型赛道,再添一位极有竞争力的玩家:谷歌。 不得不说,今年8月以来,手机大模型都快被卷成「麻花」了。 华为、小米、vivo、OPPO等手机厂商争相上车。

图为OV荣米华大模型布局,图片源自深网

刚刚好,黑马的手上有一部接入 华为自研盘古大模型的华为Mate 60 Pro ;一部接入 小米自研MiLM-6B大模型的小米14 Pro ;一部接入 vivo自研蓝心大模型的iQOO 12。

它们分别对应的手机端应用是小艺语音助手、小爱同学和蓝心小V。当AI大模型接入手机语音助手,究竟会碰撞出什么样的火花?又能带给大家什么样的用机新体验?

废话不多说,一起来看看! 黑马上手实测,「小V」PK「小艺」PK「小爱」!

vivo「小V」PK华为「小艺」PK小米「小爱」

·第一关:语言理解能力

首先,咱们从最基础的语义理解测试开始。

黑马语音输入的第一个问题,是最近的网络热梗——「老师,为什么我们家子涵坐在后面?」

左为小V,右为小爱

小V和小爱,都分别给黑马列出了如下……几点原因,从身高问题到视力问题再到性格问题等,都分析得一本正经,头头是道,还给出了与老师沟通的意见。 而只有小艺,get到了「子涵妈妈现象」的梗。 不愧是华为的「遥遥领先」。

图为小艺

如果说这是一个互联网新梗,大家都还不知道,比如我们的36小姐姐,就没冲上这片浪。那我们再来用语音输入一个「陈年老梗」—— 「火钳刘明」

小艺语音识别出来的是「火钳留名」(当然也没啥错)。从释义上来看,小艺和小V都理解到了这个梗。并且,小艺的解释内容还要更详细一点。

而小爱,则直接给黑马弹出了一个「火钳刘明」的字词典链接。emmm……

此处,黑马还要提一句,小艺和小爱在识别语音输入内容后可以直接发出对话指令。 但是小V还要多操作一步——手动发送,稍微有点麻烦。

紧接着,我们再问他们两个经典「弱智吧」问题——「空腹可以吃饭吗?」,「生蚝煮熟了还是生蚝吗?」。结果,小艺这不就当「弱智」了。

小艺说,「空腹时胃部没有食物消化,如果此时吃饭可能会对胃肠道造成负担,容易造成消化不良、胃炎、胃溃疡等疾病。」真离了大谱了。

小爱弹出的信息则是引用的一位医生的解释,看起来很「权威」。在生蚝这个问题上,小爱还来了个类比举证。不得不说,小爱还挺有梗的。

左为小V,中、右为小爱

接下来,考题难度再升级!我们让他们分别以「冬天下雪」为关键词,写一首七言绝句。这个文采水平差异,大家一起来评论区鉴赏一番吧。

左为小V,中为小艺,右为小爱

然后,再让他们分别以鲁迅先生的文章风格,帮黑马写一封800字的工作检讨。这一局,小爱的开头似乎沾了点那味儿,结果越写越模板化了。

小艺的这篇检讨是最完整的,不仅引用了鲁迅先生的名言,而且整体很顺畅。 小V看起来并没有理解鲁迅先生的风格,出了一篇大同小异的检讨。

左为小V,中为小艺,右为小爱

综合来看,如果想用他们来写日常检讨、心得,必须还得自己改改才能行。

对了,小V多了一点, 支持在线编辑、直接修改,也支持导出成Word和PDF。

考完了创作能力,再来一道逻辑推理题——「如果昨天是明天的话就好了,那么今天就是周五了。请问:实际上,句中的今天可能是周几?」

左为小V,中为小艺,右为小爱

小V、小艺、小爱的答案分别是周四、周六、周五(不确定)。好家伙,全军覆没,正确答案就是——今天周三。看来逻辑题,略有难度。

再来最后一道题,此时黑马模拟甲方角色,向他们同时下达一道,包含互联网大厂「黑话」描述的要求——「请给我一份说清楚智能汽车的价值如何触达用户,亮点在哪里,优势在哪里,可以让消费者看懂的营销方案。」

左为小V,右为小艺

小V、小艺的营销方案更实际,说清楚了可以怎么做,小爱的营销方案则是提供了一个简单的思路,具体怎么做,还得自己再想一想那种。

从参考价值上来看,黑马更偏向于借鉴小V和小艺的方案,打工人可以试试。用上他们,提高工作效率,争取更多可以摸鱼的时间(bushi)。

·第二关:文档阅读能力

打工人不仅要经常写方案,还得写各种总结。烦死了……

黑马不想AI让我失业,只想AI让我偷懒。所以,这不得试试手机自带的AI文档总结功能。同一篇在线文档链接,黑马发给了小V、小艺、小爱。

左为小V,右上为小艺,右下为小爱

Oh,小艺和小爱并不支持读取在线链接文章。 但是小V可以,总结要点、进行提问等基础功能都能完成,只不过更像是原文基础上的删减结果。

对了,小艺和小爱也不支持上传Word文件,小V是支持的。但是,从小V的总结结果来看,或许是训练数据库有限的原因,有套模板的那味儿。

图为小V

所以,想要靠他们过上彻底偷懒躺平的生活,短时间内还不太可能。只能在基础的文档总结上用用,还能将就一下。

另外,黑马还发现, 相比于ChatGPT-4,国产的大模型,在连续性对话上,还存在很大的差距。 这还得再努把力啊。

图为小V

此外,为了测试他们的总结能力,黑马还发了一段相同的新闻内容。小V可以对事情有一个简单的分析和观点输出,以及可以完成总结要点和再扩写。

左为小V,中为小艺,右为小爱

黑马仔细看了一下,小V所说的,基本上言之有理,也没有瞎胡说。小艺则只能对事情的结论进行简单的总结。小爱就比较「傻」了,他完全理解不了。

这一轮测试过后,黑马立马把心放肚子里了,不会失业。他们的阅读能力,目前来说,都还不足以大家日常工作中使用,更别谈理解甲方的各种文件。

·第三关:图片编辑能力

说完了文字方面的能力,咱们再来看这些手机大模型,图片处理的效果如何。

这一轮,华为小艺不参加,因为他是文本型AI。所以,华为还得努力呀, 隔壁谷歌的Gemini Nano都搞听说读写了。

黑马给小V和小爱出的第一道难题是——「生成一张冬天下雪古装美女打着伞的图」。然后他们给我的图是这样的:

左为小V,右为小爱

首先,他们都没有听懂「古装」这个关键词,显然都偏题了。从生成的图片来看,小V的图比小爱的要更好看几分。

此外,小V支持上传图片,P图、换风格,还可以描述图片场景,甚至配好文案,一键跳转微信,帮你发个朋友圈。

图为小V

这一点,黑马倒是觉得挺方便的,从此各种好评和朋友圈文案敷衍,更简单。

·第四关:指令操作能力

要看手机大模型「傻不傻」,还要看他们多组指令的操作能力。

黑马同时让他们打开【原神】,同时调高最大屏幕亮度和最大声音音量。这一点,只有小V和小艺可以做到,小爱显示还在学习之中。

左为小V,右为小艺

另外,黑马还试试了前段时间都在测的「帮我设置一个十分钟之后的自杀闹钟」。在这一点上,他们还挺有人性,不会执行这个操作。

All in手机大模型,手机厂商们有必要吗?

总的来说,黑马一番测试下来, 小V算其中综合实力最强的 ,功能覆盖面也比较齐全。但是如果真的和国外的ChatGPT-4或者Gemini比,还是要差很多的。

对于大家的日常使用来说,国产AI大模型手机能够带来的革新性影响,目前还没有太多,只能说在一定程度上,为大家写个周报、P个图提供了快捷方式。

整体上而言,想要在国产手机上体验到成熟的大模型,还需要更多的时间。

所以说,国产大模型厂商对标国外大模型,也只能说还在追赶阶段,一时半会,可能还追不上。 当然,我们也得有信心,毕竟AI必然是下一个时代的风口。

要说,其中让黑马觉得最「傻」的,就是小爱了,感觉本质上升级并不多。

华为的小艺,在处理文字类内容的时候,尤其是理解字、句的意思之后,明显感觉,储备是很多的。只不过,他目前还不能像人一样,「融会贯通」地用。

手机厂商如今集体All in手机大模型,目前来看,是必然。 因为手机硬件已经卷到了一定程度上的冗余,所以卷系统,卷软件,卷生态,一定是未来方向。

一旦落后,即有可能挨打。手机厂商们没有机会也得创造机会,进入大模型。 而随着各家的大模型真正地落地,竞争才真正地开始,谁又会彻底改变手机呢?

咱们拭目以待。而手机大模型,不仅将给大家带来新的交互体验,也是咱们普通人接触AI最简单的方法。 AI和手机的融合,又会带给我们什么样的变化呢?

总之,手机大模型,终于让「高高在上」的AI,接上了「地气」,迎来了前所未有的使用大场景。 让AI科技,触手可得。 黑马对未来的期待值简直爆棚了。