头图:
近期,AI领域的发展呈现出一种矛盾的景象:表面上百花齐放,实则暗藏疲态。人工智能领域似乎进入了一个微妙的节点,众多科技巨头和创业公司纷纷推出自己的AI产品,却难掩同质化的窘境。
Character.ai的风波就是一个案例,作为AI明星产品,Character.ai在高峰期的推理请求量已经达到了谷歌搜索流量的五分之一。五个Character.ai就等于一个谷歌?然而,真实的情况不容乐观,根据The Information的报道,Character.ai订阅用户不到10万,近期在努力削减成本,由于融资困难,Character.ai正在考虑出售。
AI社交大多产品都局限于伴聊和角色扮演功能,又存在重度用户消耗推理资源量大,而轻度用户留存差,商业化前景堪忧的问题,例如,Character.ai去年全年收入仅为1520万美元。
Character.ai的困境并非个案。纵观整个AI行业,从科技巨头到初创公司,似乎都陷入了一种「雕花」困境,过分关注表面功能的堆砌,底层的突破出不来了,突破性的创新让位给了同质化的功能微调。
WWDC24上,苹果公司为iPhone和其他设备推出了推出全新的个人AI系统Apple Intelligence,试图通过重新定义「AI」来弥补其在AI布局上的滞后,但除了一贯的强调隐私保护,实际功能展示乏善可陈,集成ChatGPT功能,实现识别对用户情景重要的通知,AI文本处理,图文生成、Siri感知屏幕内容并代替用户执行简单任务。
而Apple Intelligence也免不了「期货」,几天前刚刚开启了测试,第一批功能的正式上线可能需要推迟到十月的iOS 18.1,但也只是基础功能。使用设备端数据回答问题并了解用户屏幕上内容等功能,仍然需要2025年春季。
更加遗憾的是,Apple Intelligence仅支持搭载 A17 Pro 芯片或更新的iPhone,也就是说大部分iPhone用户都体验不了。
微软则试图在PC上进行革新,在5月20日推出了Copilot+ PC,其中包含了人工智能工具Recall,它会定期截取屏幕截图来创建活动记录,以便用户搜索他们之前的操作。
事实上,Recall之前,一款类似的应用Rewind已经上线一年多时间了, 并且拿到了Sam Altman、a16z 等的投资。本质上Recall并没有任何创新,而只是抄了一个Rewind。虽然微软对Recall寄予厚望,不过得到的却是差评,许多用户认为存在巨大的隐私风险,有黑客甚至展示了如何从Recall的主数据库中提取所有信息。出于安全考虑,微软搁置了Recall的发布。
OpenAI作为火车头,也开始在「雕花」方面不遗余力。其备受瞩目的AI视频生成模型Sora发布时间悬而未决,官方解释称还有大量的安全工作要做,但始终没有给出明确的时间表。
同样让人失望的还有号称「Her走进现实」的GPT-4o语音模式,这个本来就被不少人形容为已有的功能堆砌出来的小创新的产品,原定于5月发布,后又一再跳票,只是时不时的用给一小撮人试用一下的方式维持着大家的期待。即便是最新推出的SearchGPT,也难掩其「期货」属性:不仅内测机制黑箱,连Demo都存在低级错误。
在一些网友看来,与其将精力放在实质性的技术突破上,OpenAI似乎更热衷于制造舆论热点。一系列针对谷歌的「抢热点」发布的操作的确相当亮眼,Altman非常利用社交媒体影响舆论,为自家产品造势,然而,漂亮的PPT和热闹的发布会并不能掩盖模型能力迭代缓慢的现实。
GPT-5何时推出已经彻底成为了一个谜。市场曾预测GPT-5可能在2023年底或2024年夏季发布,OpenAI CTO Mira Murati表示有望在2025年底或2026年初推出,而Sam Altman曾强调目前没有固定的发布时间表。
小参数模型GPT-4o mini的推出基本说明了一切。OpenAI也要跟大家卷「雕花」了。
「雕花」的AI产品
在头部企业陷入「雕花」困境的同时,创业团队也未能幸免。随着「模型即产品」的投资窗口期过去。厂商们面临着巨大的变现压力,迫切需要寻找落地场景。AI搜索似乎成为了继聊天机器人和类Character.ai产品之后,又一个开发者们争相涌入的赛道,成为新的热点。
AI搜索被视为大模型应用的重要落地方向,海内外众多企业和开发者纷纷布局,希望在这个风口上分一杯羹。然而,目前的发展态势似乎也难逃「雕花」的困境,所有人似乎都在重复造同一个轮子。
众多玩家推出的AI搜索产品大同小异,缺乏实质性的差异和创新。虽然在功能名称上略有不同。但核心功能几乎如出一辙,这其实也反映出当前大模型的发展遇到了瓶颈。
浏览器插件因其轻量化、低门槛的特点,也成为成为各家争相布局的对象。月之暗面的Kimi浏览器插件强调「轻量小搜索」,字节的豆包浏览器插件也在快速迭代新功能。各类开发者制作的AI插件也是层出不穷。
表面上,这些插件五花八门,功能各异。有的专注于内容生成,有的侧重信息汇总,还有的致力于提高生产力。但仔细观察就会发现,它们大多是在做「雕花」工作,许多插件不过是对已有AI功能的简单封装,或是对大模型API的表层调用,鲜有真正突破性的应用。
所有人都希望获取到用户流量。但这种做法更像是权宜之计,并未从根本上解决商业化难题。PC浏览器用户数量相较于移动端已经相对稀少,这一现实本身就限制了插件的潜在用户基数。它再次印证了当前AI行业陷入的'雕花'困境,在现有技术框架内进行小幅改进和优化和同质化竞争。
回顾上一波以计算机视觉(CV)技术起家的AI企业的起落,我们发现它们并未真正走出「雕花」困境。尽管在技术上取得了显著进展,但场景碎片化和商业化不顺仍然成为它们后继乏力的主因。这些企业往往停留在技术供应商阶段,难以确保长期市场地位,同时还要与科技巨头打价格战,争夺市场份额。
如今,大语言模型似乎正在重复这一历史。虽然GPT等模型在技术上取得了突破性进展,但真正能创造持续价值的商业应用仍然稀缺,模型能力的提升也似乎进入了停滞状态。
OpenAI提出的通用人工智能五级能力评估体系为行业提供了一个发展路径。当AI达到第二阶段('推理者'级别)时,可能具备在消费级市场大规模流行的条件。这意味着,大模型公司需要不断提升AI的通用泛化能力,才能真正突破商业化和产品化的瓶颈。不过在此之前,OpenAI可能还需要融资数百亿美元才能覆盖其成本。
与CV企业不同的是,一些大模型公司已开始推出面向C端的应用,试图接近产品市场契合点(PMF)。这种策略可能帮助它们避免单纯依赖B端非标准化市场的陷阱。但如果仅仅是将现有的AI能力套卡包装成消费级产品,没有真正的突破模型的推理能力、增强跨领域知识整合,以及交互体验等等,很快就会陷入同质化的雕花当中。
华尔街也失去耐心了
为了迎接AI革命,企业仍在投入大量资金建设数据中心等基础设施,但即使是华尔街也开始重新审视他们的调子,从狂热的拥护转变为更为谨慎的支持。
AI进入雕花阶段是否意味着互联网泡沫的重演?最近的一系列研究报告向AI的热潮泼了冷水,警告生成型AI技术依然面临漫长而充满疑问的发展道路。
当高盛都说「也许这只是一个泡沫」时,你就知道这个行业真的遇到了麻烦。在一份名为【生成型AI:过多投入,收益太少?】(Gen AI: too much spend, too little benefit?)的报告中,高盛的分析师讨论了AI是否能解决其被赋予的复杂问题,并对其仍未确定的「杀手级应用」表示怀疑。
巴克莱银行的一份研究报告标题更加生动【云AI资本支出:害怕错过还是梦想田野?】(Cloud AI Capex: FOMO or Field-Of-Dreams?),报告指出数据中心投资是否正在制造一个可能像1990年代互联网泡沫后电信崩溃那样的泡沫,分析师的结论是倾向于FOMO。
红杉资本的合伙人大卫·卡恩最近称,技术是否能收回庞大数据中心投资是「AI的6000亿美元问题」。
这显然不是第一次质疑的声音。关于AI聊天机器人和其他工具的最终收入或潜力问题,已成为任何科技公司财报电话会议上的常见话题。
而微软和英伟达的巨大收益,属于高盛分析师所称的AI投资「卖铲子和镐」的阶段:提供AI所需的半导体、云计算和能源的公司。值得注意的是,AI为Google、微软、亚马逊等头部云厂商带来的增长已经开始放缓。
高盛全球股票研究负责人吉姆·科维洛则怀疑,AI的成本是否会下降到足以证明其价值的程度。「要证明这些成本是合理的,技术必须能够解决复杂问题。」
高盛还采访了MIT经济学家达隆·阿西莫格鲁,他认为这项技术仍远未准备好迎接主流。「鉴于今天生成型AI技术的重点和架构,这些真正变革性的变化不会很快发生,如果有的话,可能在未来10年内也不会发生。」
巴克莱分析师将AI支持者的思维描述为「只要我们开发出AI技术,用户和利润自然就会跟着来」的逻辑,并指出目前的资本支出预测足以支持到2026年12000个ChatGPT规模的AI产品。鉴于投资金额,分析师表示,行业可能正走向类似于互联网泡沫后的电信崩溃的「过度建设」,「明年可能会出现AI投资的调整期。」
红杉资本的合伙人戴维·卡恩还指出,AI还有很长的路要走,警告投资者在「投机狂热」中保持「冷静」。「我们需要确保不要相信现在从硅谷蔓延到全国,乃至全世界的幻觉,」卡恩写道。「这种幻觉认为AGI明天就会到来,我们都需要囤积唯一有价值的资源——GPU。实际上,前方的道路会很漫长。」
人工智能将永远改变商业一切,这已成为商业和学术界的一句口头禅,AI也已成为一个家喻户晓的术语。但这是曲折上升实现的,自20世纪50年代以来,AI经历了几次寒冬,由于未能实现期望而导致对AI兴趣的减弱。这种起伏的背后是对技术的期望与现实之间的复杂关系。回顾这些发展过程,能为我们理解当前生成式AI热潮提供一种历史视角——这里似乎存在着一个规律,就是对AI技术的乐观随之而来的往往是一段挫折期和AI投资下降期,用人们爱用的词来说,就是AI寒冬。
人工智能目前可能仍停留在拨号时代,直到拨号上网逐渐消失后,互联网才真正发挥出潜力,同样的,总有一天我们会拥有一种新的人工智能形式,让今天的ChatGPT像1998年的门户网站一样过时,只是可能无法指望它会在未来一两年内发生。