当前位置: 华文世界 > 科技

宇树创始人王兴兴:多模态模型还非常糟糕

2024-07-15科技

在宇树科技发布人形机器人G1发布的一个月前,波士顿动力也发布了第一款纯电驱动的人形机器人,也就是全新的Atlas。

「他们发布的时候,其实我们公司内部非常开心。因为其架构跟我们的非常相像,这也间接说明,我们也做得比较好。」宇树科技创始人及CEO王兴兴说道。

他顺便还作出了澄清,表示宇树不可能是学波士顿动力,因为大家此前都还不知道后者在做纯电驱人形机器人。

在本月的WAIC上,王兴兴带来了主题为【具身智能是实现AGI的最有效途径】的报告,不仅对机器人产品进行了梳理,也对当下的AI发展发表了观点。

由具身智能走向AGI

王兴兴指出,现在业界流行将神经网络的规模做得更大,这本质上也确实很容易实现——随着神经网络的规模增大,智能水平越来越高,这是简单明了的第一性原理。

但是,目前的大语言模型、多模态模型仍难以实现对整个世界的理解。

「模型对时间、空间和物理定律的理解非常重要,这对于动物和人非常简单,但目前多模态模型还是非常糟糕的。」

之所以王兴兴相信 「具身智能才是实现AGI最有效的途径」,是因为依靠「躯体」收集的数据非常重要。

「只有部署到真实的机器人上去,参与到真实的世界中,去理解每个人的情绪,才能让数据真正有效。」他指出,让机器人理解人类情绪也非常重要。

在他看来, 机器人在物理世界的全息采集、性格采集非常重要。因为人在解决吃喝拉撒等生理需求后,最大的需求就是情绪价值。

单纯的大脑,只适合做梦

具身智能最大的点就是被赋予了躯体,而传统的AI只停留在文字和图像上。

王兴兴认为,自然界有一些动物,之所以无法实现更复杂的任务,并非是由于大脑的智能程度不够,而是身体构造限制了它们的发展。

「做梦的时候为什么跑不快?因为这时大脑脱离了对身体的控制,脚步没有接触地面,也没有任何反馈,所以永远跑不快。」

这也体现出了具身智能对于AGI的重要性—— 单纯一个「大脑」不顶用,它很容易活在「梦境」里。

「像现在的大语言模型等等,很像活在梦里面,有时也像是说梦话。可如果结合肉体和感知对世界的理解,它可以真正有活着的感觉,这也是体现了目前对具身智能的重要性。

王兴兴认为,知名学者李飞飞的「空间智能」与他理念接近,同样是要推动AI与物理世界的互动,去弥补平面数据的不足。

「目前全球顶尖的专家都在推动世界模型的构建,这能让机器人真正理解整个世界,而且是通用的世界。例如同一台机器人,今天可以在工厂干活儿,明天就可以去你家里做饭。」

机器狗与机器人

据王兴兴介绍,目前宇树正在开发更复杂的整机运动。

尽管机器狗更容易做出复杂动作,但今年宇树的大部分精力还是放在了人形机器人上。不过,机器狗倒是帮了人形机器人的大忙。

「很多人觉得机器狗和人形机器人差别比较大,但其实,不管从硬件角度还是软件角度看,它们的相似度非常高。这也是为什么我们去年花了半年多时间就可以造出第一台人形机器人。」

王兴兴表示,在国内做人形机器人的公司中,很多是借鉴了早些年四足机器人的硬件设计和软件,包括深度强化学习算等。

他介绍称, 宇树的 机器狗是通过纯端到端训练的,即通过头部的深度相机直接用神经网络输出关节扭矩,效果非常理想。

「大家可能想象不到,整个AI控制环路频率没有那么高,大概只有几十赫兹。」

王兴兴表示,在人形机器人运动控制上,可开发的事情还有很多。至少目前,人形机器人仍未超越人类。

在1-2年内,宇树希望能让人形机器人实现覆盖全地形的、更高难度的动作,包括更复杂的舞蹈、跑酷等等;至于手部操作,机器人将承担一些工厂或服务业工作,包括基于端到端AI训练的导航、巡逻等等。

宇树G1开始量产

去年,宇树发布了第一款人形机器人p,它跑步很快,还能实现原地空翻。而且它并没有像波士顿动力那样使用液压,只是纯电驱动。

这看起来简单,但实际上对硬件、电池、电控系统和软件要求都比较高,毕竟这台人形机器人有50kg+,1.8m高。

今年5月,该公司发布了第二款人形机器人G1,这款人形机器人的体型相对小一点,高1.3m,但关节数量、关节自由度、关节运动空间,以及外观都达到了顶配的级别,售价9.9万元起步。目前它已开始量产,并开始接订单。

「G1的关节都是内轴式的走线,所以整体更加整洁、干净。且关节运动量非常大,重量只有35kg,整套动作都是通过深度强化学习做的。」王兴兴介绍道。

AI领域,人人平等

目前,G1的整套运动控制算法都是用深度强化学习驱动的。

「进步其实比大家想象得更快,我个人比较乐观:最迟明年年底之前,全球肯定会出现比人跑得快的人形机器人,比如说很有可能100米跑进10秒。」王兴兴表示,人形机器人在体育项目和文艺演出上,会比干家务进步得更快一些。

在谈及当代AI热潮时,他认为,AI不是传统学科,没有深厚的积累。目前在AI领域中,人人平等——大家要学的都是10年内出现的知识。

「目前AI还跟小学数学差不多,没有想象的那么难。AI的发展节奏跟数学领域的小学生的算术水平差不多。」

但他也觉得,当下是非常激动人心的时代,相比过去人类几万年或者几千年的历史文明,AI是更有意思的点。

「大家都很年轻,当下我们这个时代的人,未来5年肯定有很大的技术突破,最多绝不会超过10年。」