当前位置: 华文世界 > 科技

大模型为何不知道「13.8大还是13.11大」?傅盛解析

2024-07-27科技

来源:睿见Economy

2024中国企业未来之星年会于7月26日-28日在上海举行。猎豹移动董事长兼CEO、猎户星空董事长傅盛出席并演讲。

傅盛表示,很多人问将TikTok原型卖给张一鸣后不后悔,「没有什么后悔的,因为我们没有这个基因,字节就是做得好」。他认为,「如果(我们)自己做,肯定不如今天TikTok做得好。每个人、每个团队都有自己的能力圈」。

谈起今日火爆的大模型无法正确解答「13.8大还是13.11大」的原因,傅盛解释说,这是大模型的缺陷之一,因为大模型仅是字符串的学习。「大模型的幻觉和一本正经的胡说八道,它不知道自己不知道,人说错话,马上就知道,但大语言模型不是,它一本正经的讲林黛玉打虎的故事,讲得活灵活现,它没有反思能力」。

以下为演讲实录:

傅盛:我想说有时候归不归零,不是你说了算,而市场说了算。

有一次我写了一个PPT给张一鸣看,我说有时候是被逼的,有时候是有远大的理想,张一鸣看了以后说都是被迫,哪有什么远大的理想。科技浪潮席卷而来,我们必须要不断跟进。

2010年开始创业,我们创立了猎豹移动。经历了三个时段,第一个时段把金山毒霸工业软件变成了企业软件,现在还有营收,同一期的软件都没有了,金山毒霸还有营收。第二个时段,我们发现中国的APP红利没有了,到了全球6亿阅读活跃用户,其中4亿来自海外,TikTok也是我们天使投资,后来卖了头条。

之后我们想找一个大的风口,16年我们看到了AI,当时我们都认为可以快速改变人类,可以快速做AI。但有时候技术不是一直高歌猛进,有高潮期,也有低谷期,终于等来了ChatGPT,模型就应该以AI为核心,所以我们的slogan:AGI时代成为全球领先的新质生产力工具提供商。

很多人问我卖掉TikTok(原型)会不会后悔,没有什么后悔,因为我们没有这个基因,字节就是做得好。如果自己做,肯定不如今天TikTok做得好。每个人、每个团队都有自己的能力圈,最早我开始打造360安全卫士,到后面选择工具,就是因为我们的基因,我们团队就是做工具,能把工具做好不错了。

我大致讲一下AI很热,很多人都知道,我还是做点科普。如果再做几十年回头看这一波AI浪潮,可能和前面看牛顿和爱因斯坦一样。前段时间我去拜访罗振宇,很多企业家都是这样,现在的环境下如何创业,罗振宇说就是两件事:第一,真正追求快速闭环,一个摆摊的哪怕出现很大的变化,也有自己的小循环;第二,做一些穿越周期的事,爱因斯坦1905年的四篇论文,「相对论」奠定了现在的信息技术基础,2023年我们认为ChatGPT的出现,会改变人类社会的方方面面。最近阿里巴巴的王坚说AI也会改变科研,以前科研是假设性科研,就是我们看到很多现象做一个公式的假设,但以后科研就是端到端的科研、数据类的科研、直接给出结论的科研。

为什么这次的AI和16年看到的AI不一样呢?因为那时候看到AI很激动,觉得计算机可以识图、认人脸,就觉得它可以做一切。今天看起来识别并不是人类独有的技能,识别是一种感知,狗也认识你,语言才是人独有的技能,尤其是推理的语言。今天看起来能够突破语义理解就是人工智能的重大突破,在ChatGPT出来之前,行业都认为语义理解不知道什么时候会实现。

ChatGPT之所以牛,就是因为它改变了学习路线,之前的大部分路线是让计算机学规则,就是学定、状、主。但是OpenAI相信只要给它足够多的语言数据,OpenAI就会像小孩一样突然有一天开口说话,就会理解语言。在此之前,大家都没有那么相信,所以其实在GPT3.0出现之前,OpenAI在硅谷都不被看好。所以,ChatGPT不是技术的胜利,而是技术信仰的胜利。

因为人工智能就像大树下,Transformer都是一样的。像Google、百度这样的大公司,他们觉得智能可以通过规则以及语言的理解才能完成,但OpenAI相信只要做好下一次预测就能产生智能。这条路线非常艰难,艰难在于并不知道它的核心原理,但必须坚信,要不断的试。它最难的是每次试都要花几千万美金,再去试,试完之后再调整。今天「百模大战」不是技术的难度,而是技术信仰的难度,真的敢于相信、敢于投钱,才能真的把ChatGPT做出来。

今天有很多文章说它产生意识,说它替代人类,都不用相信它,ChatGPT就是预测下一个词的计算机,不断预测下一次就产生了智能。前首席科学家真的很厉害,他认为只要给足够多的数据,计算机就会预测下一个词,通过不断的预测就可以产生智能,通过不断的预测就可以完成整体的涌现。他做了类比,一本侦探小说两三百页,翻到最后一页说杀手是谁的时候,如果脑子里出现了这个人的名字,正好就是这个杀手,说明你读懂了这本小说。因为每一个下一个词的涌现都是对前面所有文章的理解。

还有一点,为什么能出现这样的智能,它的原理还属于黑盒,就是没有数学公式推导能证明会出现这样的智能。我们这个行业有一个俗语,每次训练大模型就像炼丹,开始炼的时候不知道效果怎么样,一定要最后结果出来才持续。

为什么OpenAI很厉害呢?16年我们开始做语音识别、视觉识别的时候,随着数据量的增加,以前系统的智能水平很快就上来了,但是它只能上到一定的水平,这次给了大量的数据,它一直不怎么样,突然有一天(这是一个形象的比喻)某一个时刻,水平一下子就起来了,到了原来系统到不了的智能化水平。各大模型都是这样,基本上训前两个月看这个模型的水平很一般,到第三个月就起来了,就是这样的标准。所以我说是技术信仰。

因为技术信仰,今天我们也认为OpenAI的道路也不是唯一正确的,未必是唯一正确的。因为技术有意思就在于它不断的分支,不断产生新的可能性,当OpenAI在大参数模型上一骑绝尘的时候,越来越多的小参数模型开源社区开始出现。大家认为既然这条道路上可以产生智能,那用更少的参数能否产生智能,所以看科技的本质就是不断think difference的过程,正是不断的think difference才能有更多的创新。

即便是OpenAI如此大的公司,超牛的公司也要造一个爱因斯坦,造出一个爱因斯坦全世界都解决了所有的问题。但是也有一帮人没有那么有钱,技术没有那么强,能不能做一个平民化的模型,只要解决专门的问题就行了,今天开源阵营就是在做这件事,用更便宜的算力成本、更小的参数量在某一个领域实现更好的效果,最近微软、苹果发了,去年我们就有这样的判断,认为一定会出现这样的分支,所以我们坚定都在开源阵营的道路上。

去年我和朱啸虎有一次吵架,做AI到底是应用重要还是模型重要?当时由于大模型出来,他震惊了,很多人都认为大模型会占据99%的产业链价值,但当时我就说应用是核心。今年世界人工智能大会,几乎每个大佬都在谈应用,大家终于意识到给一个聊天窗口,给一个用户,就可以解决他生活中的所有问题,这件事情不可能,只有结合实际的需求,足够多的应用,才能让大模型人工智能为更多用户所用。

前两天美国苹果发布的iOS 18,股价涨了10%,涨出了一个茅台和腾讯,这是苹果历史上第一次没有发布任何的硬件产品,而是发布一个概念,就是因为把Siri的概念重新包装了一遍,不能用「包装」,才失敬了,就是重新升级了一下,它就变成了你的助理,它用GPT技术做了交互。交互革命和生产力革命,毋庸置疑了,历史上机器人都在围绕人转,所有的终端都会被重新改造一遍。未来siri就是我们和手机最重要的交互窗口,未来siri通过它对你的预测就可以完成,苹果的展示里就有,siri说:明天你妈妈要求来机场了,记得去接她。这是助理的方式,以前是很难想象的。

生产力革命是第一次把电能转化为通用智能,人工智能引发全世界、全社会特别关注的核心。虽然以前我们有很多智能系统,但每个智能系统都要做开发、做适配,所以它并不能实现边际成本趋近于零,这次是可以实现的。

三星也发了一款手机。

推荐大家用一下meta搜索,搜一下就是一份报告。这两天ChatGPT推出了自己的社区GPT,搜索就是一个强应用。因为以前搜索要搜几十个网页,把内容整理出来。像Meta这样的产品,就可以把网络调出来,整理为一份报告,把需要一个晚上时间整理的报告变成了2分钟,搜索一定是重要的革命。

还有就是Copilot推出的SHC,它没有用英特尔的芯片,而是高通的芯片,高通的芯片是有45Flops的GPU,它可以独立处理AI的各种运算,有可能你对电脑说今天晚上把哪些文章搜一遍,整理出哪些东西,你走了,它就在工作。以前计算机也是一个生产力工作,但必须人伴随它,以后就是把计算机一放,它就把该做的做了。

我们讲讲自己的应用。讲了AI这么多强的地方,我要讲讲行业不行的地方。行业有很多有意思的事,看起来AI非常热但好的案例几乎没有,除了大模型公司自己讲,真正在客户没有落实好的案例。而且今天很多人都在说我们都在期待一个好的to C应用,好像都没有出现。

尤其是我们在做企业应用,在做机器人,它有三大阻碍:第一,我们的训练数据来自互联网,但互联网实际上是冰山显露出在睡眠的一部分,我有个比喻,跟牛顿学力学,是每天和他喝杯咖啡好,还是看他的自然科学的书,当然没有机会和他每天喝咖啡,书本是批量教育的产物,真正好的知识是深入的询问。很多知识来自日常的探讨,来自会议,来自各种讨论,但是今天大模型得不到这些数据。所以,造成的问题今天在企业用大模型的时候,它回答得都很对,但没有什么用,都是常识性的回答,很难和私有的知识连接起来。如果真的要企业应用,私有数据是关键。

这次苹果发布siri iOS18那么成功,就是因为它把手机里的各种数据打通了,邮件等等都让大模型处理。其实都不是大模型,它在端上处理的好像就是8000万参数还是1.2亿参数的模型,但数据打通之后,爆发出来的能量惊人。所以我们提供的解决方案是一定要结合企业的私有知识,像向量数据、RAG等等,但要做好都不容易。

第二,数据的安全性。大数据和云最大的不同,云在云上,是不拆包的,只要租用我的仓库,面积越大,我的生意就越好,我不关心你存了什么。大模型不一样,存的数据它都要看一遍,才能写报告和整理,这些数据都经过它了,如果不记录下来还是和人性相违背。即便美国OpenAI这样的公司都经常暴出数据被抓取等问题,所以企业就应该有自己的私有化大模型。个人以后要用好大模型,也应该有自己的大模型。苹果iOS18就是个人端的Copilot。

第三,生成式的模型,大模型的幻觉和一本正经的胡说八道,它不知道,但它不知道自己不知道。这是真正可以通达AGI的路,人说错话,马上就知道,但大语言模型不是,它一本正经的讲林黛玉打虎的故事,讲得活灵活现,它没有反思能力。今天我们发现和大模型打通以后,客服需要95%以上的能力,但大模型只能做到70%,这和模型无关,这构造大模型目前的天然的缺陷。

前两天有个东西上热搜了,你问大模型是13.8大还是13.11大,好像只有一个大模型没有沦陷,因为它就是字符串的学习。

今天业界提出了Agent的方式,通过一套规则或者自我反思、规划等等,和大语言模型在一起,去完成对一个具体场景的落地,还不能大泛。

还有很多大模型公司觉得找人用一下就可以把大模型做好,不是!我们应该是基于客户的诉求,做深度评估,才能做部署。我认为真正把标杆才能把很多东西抽象出来。ChatGPT到今天发布才不到两年,产业链上还有很多不成熟,它没有很好连接的供应商,很多苦活只能自己干。就跟特斯拉做第一辆车,除了买自己的笔记本电池,整个电路都要自己干一遍,才能做自己的产品,现在可以采购宁德时代100度的平台加个壳就行了。所以,我认为现在大模型处于很早的时代,真的要做企业案例就要和企业深度打磨。

[多媒体演示]

这是我们帮助企业深度打磨的思路。但今天我们主要想分享如何做好机器人,通过私有化的方案不需要特别强的模型,但是做好Agent应用,再加上私有知识库在很多地方可以做到95%左右准确率,满足客户的需求,这件事是可以的。我们提出一个好的企业大模型有三个段位:第一个是给企业用;黄金是把私有数据做好,然后实施;真正的王者是企业如何运营,大模型可以给出判断。以后大模型会跟新东方说董宇辉到底能不能走,付出多少成本不让他走是合算的。通过大模型的精准测算,让自己未来怎么发展好,我觉得这件事以后可以不用靠老俞一个同志了。因为美国就有这样的公司,专门通过大模型分析,给企业提供决策经营建议。

讲一下机器人。

[多媒体演示]

这不是我画的图,而是一个基金画的图,任何技术都有核心技术,把云上的能力变成端上,第三部分就是应用。我觉得今天大家讲应用什么时候会崛起?至少要到明年会在C端看到一些应用开始出现,因为一些基础的东西,我看智谱AI也发布了一个文生视频,这个能力不错,很多人就会围绕它做开发了,不再是简单的回答一句话。高通的那款芯片一出来,很多大厂都会在CPU上加上一个AI模块。这次苹果发布iOS18,专门说会给手机上开发图形的API,只有这样才能出现好的AI应用,或者深度的AI。最后是物理的AI,今天最火的是智深智能,就是自动驾驶、智能座舱都是这个范畴。

今年我们训练了一个自己的模型,我们训练这个模型的核心就是让团队学习。第二我们就是瞄准小参数,因为我们觉得以后我们的机器人上要跑本地化的模型和云端的相结合。重要的是我们和日语模型加了一下,这是开源模型里日语最好的,说实在话日本人没有怎么做过,日本人离我们有断代的差距,现在我们把日语做好,为日本人民提供大模型的服务。

这个PPT没有做好,好像是唱歌里相声说得最好、相声里唱歌最好的。我们说机器人公司里拥有自研大模型,大模型里机器人做得最好的。因为大模型对机器人来说就是大脑,做机器人,自己没有大脑,买大脑,肯定就做不好。所以我们把大模型定位为机器人的大脑,实现就是执行部分。

18年我就说AI软件、硬件和服务,为什么这些年一直不温不火呢?坦诚一下,因为以前AI的体验做不上去。我女儿经常讽刺我说:老爸,你做了一个智障机器人?那时候雪不够厚、坡度不久长,今天大语言模型会把这个体验一下子提升很多。美国说可能会出现一个新物种,用GPU+大语言模型+算力,出现一个类人的新物种,我觉得机器人就是这样的新物种。

解释一下刚才的那个问题,为什么我们要做大模型?大模型就是它的大脑,如果我自己不训一个参数模型,有一天要训千亿数据模型,我们就是要端模一体化,根据场景应用找一款好的模型,做自己的大模型机器人。大模型机器人已经开始一点一点做了,现在我们在1.0阶段,但至少要做到3.0、4.0才有体验上革命般的进步。大家都看到过餐厅的递送、讲解等等,但怎么加入了大模型就不一样,大家知道Robot这个词在英语里是「劳动力、奴隶」的意思,在老外眼里人自动的就是Robot,我们翻译为「机器人」就有了人的概念。在产研上大部分是自动化机器,没有人的概念,有大模型之后才能真正理解和决策,这是很大的改变。以前大部分都是基于规则,就像中午和罗总聊的,以前都是短刀端到端。

总的来说,它会像人一样理解世界,而且会作出决策,这个决策不需要人管中间的过程,这是机器人的极大地提升,也是工作量极大地缩小。反正总体来说就是很厉害。

[多媒体演示]

这是新潮传媒几个展厅都放了机器人,而且声音是张继学的,现在有了大模型,读一下企业简介,就可以做介绍和回答了。我们和投资的一家公司做的机器人,大家看到直播间说话的声音,像一个小姐姐一样,都是AI生成的,说带我去生蚝区看看,她就去生蚝区,会说「我们的生蚝又大又新鲜,赶快来吧」。

请小姐姐直播一个月大概卖几千块优惠券,但用机器人一天卖几千块钱,因为用小姐姐太累了受不了,但是机器人一天可以12小时,如果你愿意甚至可以24小时。这是给双汇卖鳕鱼肠。

今天很火的是具身智能的人形机器人,但是我还是要说自己的观点,我对双足在商业化成功不是很看好,作为科研是可以,如果落地到产线上工作,没有三五年就不可能。尽管马斯克认为可以,但还是很难,双臂这件是用臂做一些以前不好做的工作是可能的。所以我们在具身智能发展的是双臂。

今天有两个端,一个是Phone,一个是PC,还有一个是汽车,下一个肯定是机器人,让机器人插上翅膀就会完全不一样。最后希望所有企业家、创业者都一起全力用好AI,插上AI的翅膀。

谢谢大家!