当前位置: 华文世界 > 科技

李开复:绝不放弃预训练,中美顶尖模型只差5个月

2024-10-17科技

10月16日,继上半年发布千亿参数模型 Yi-Large 之后,李开复带领的大模型公司零一万物对外发布最新旗舰模型 Yi-Lightning,并对于坊间关于中国多家大模型企业已放弃预训练的传言进行了回应,「零一万物绝不放弃预训练」,他说。

在最新的国际权威盲测榜单LMSYS(由加州伯克利分校等国际知名高校合作创立)上,Yi-Lightning刚刚超越了今年5月发布的GPT-4o版本及Claude 3.5 Sonnet,排名世界第六,中国第一。这也是在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现超越 OpenAI GPT-4o的成绩。

「如果真的计算中国赶超美国有多远的距离,至少零一万物只差五个月。」李开复说。不过他也提到,要进一步缩短时间差非常困难。

「头部公司资金、算力不是问题」

最近,在自媒体平台上,关于国内大模型创业公司AI「六小虎」(智谱、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰)有一些负面传言——称某几家已经放弃预训练模型,而是将业务重心转向AI应用,并称零一万物就是其中一家。

所谓预训练,指的是在特定任务上进行微调之前,对大语言模型进行的初始训练阶段。有业内人士比喻道,预训练就好比大模型的基础教育阶段,赋予模型海量而通用的知识,是决定模型性能最关键的阶段,也是模型厂商最核心的技术壁垒。

在Yi-Lightning发布之际,李开复再次对「中国大模型行业将逐步放弃预训练」这一业界推测作出回应。他表示,做预训练通用大模型是一个系统性技术活,需要众多懂芯片、模型、推理、架构、算法的人才,做这件事的成本也非常高,不是每家公司都可以做成。「以后可能会有越来越少的大模型公司做预训练。」他判断称。

不过李开复也表示,据他所知,作为行业头部公司,「六小虎」均有足够的融资额度,都付得起预训练模型Production Run(投产运行)三四百万美金一次的训练成本,只要有足够好的人才和做预训练的决心,资金和算力资源不会是问题。

世界顶级模型要能做到「白菜价」

在攻坚大模型公司核心技术壁垒的同时,大模型行业的商业化落地无疑已成为多家大模型创业公司发展中的裉节点。

在过去,模型性能与推理成本之间的投入产出比一直是企业们在选择大模型时必然要考虑的因素。据了解,此次上线的Yi-Lightning的 API 定价至行业极低水平——每百万 token 仅需0.99元。李开复称,「要有世界顶级的模型做到白菜价」,才可能实现通用人工智能普惠落地。

「我们真实的成本比每百万token0.99元更低,并不是亏钱拉用户。我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润。」在回应是否烧钱打价格战问题时,他说,大模型只有实现高性能、白菜价,才能真正激活健康的生态环境。

发布会上,李开复还首次对媒体公布了零一万物企业级AI 2.0 数字人产品和落地进展。基于以Yi Lightning 模型为代表的 Yi 模型,其搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,其解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括餐饮连锁、酒旅类头部企业等。

其中,角色大模型为AI 2.0 数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过了多国语言和情感表达的门槛,电商话术大模型则成了数字人主播的「AI 大脑」,负责链接知识库,完成智能对话。例如,当某头部酒旅企业在接入Yi-Lightning 加持的数字人直播后,数字人几乎能够以假乱真,对观众的弹幕问答能给出精准、有人情味的回应,其直播商品交易总额较此前上升170%。

大模型长跑「技术+应用」都不能落下

随着中国大模型行业从狂奔进入到「长跑」阶段,如何让大模型技术走出实验室,走入实业助力新一波经济增长,成为各方关注点。

李开复透露,截至目前,零一万物ToB(企业级)解决方案已在零售、医疗、教育、物流等领域内完成落地,涉及 AI 搜索、AI 生产力工具、AI 智能巡检等应用场景。自今年6月开始,零一万物相继宣布与阿里云、360、顺丰科技、飞书、钉钉、钛动科技等头部企业达成合作,已积累起了一批包含世界 500 强企业在内的付费企业客户。

「我们会坚持‘模型+AI 基础设施+应用’三位一体的全栈式布局,以国际SOTA (State of the art,意为「最先进的」)的基座模型为基础,积极在企业级解决方案上探索TC-PMF(技术成本产品与市场契合度),助力中国打造以大模型为引擎的新质生产力。」李开复说。

来源:北京日报客户端

记者:孙奇茹