价格比同行低99.3%，字节挑起大模型价格战

2024-05-15科技

5月15日，字节跳动正式对外发布豆包大模型。火山引擎是字节跳动旗下云服务平台，豆包大模型原名「云雀」，是国内首批通过算法备案的大模型之一。目前豆包大模型日均处理1200亿Tokens文本，生成3000万张图片。

今日火山引擎总裁谭待重点披露了豆包大模型的商业化价格——豆包主力模型在企业市场的定价为0.0008元/千Tokens，即0.8厘的价格可处理1500多个汉字，较行业平均价格便宜99.3%。市面上同规格模型的定价一般为0.12元/千Tokens，是豆包模型价格的150倍。

但火山方面并未披露豆包大模型的具体参数规模。火山方面人士对记者表示，目前参数规模已经不是衡量大模型能力的唯一指标。采访中谭待表示，「今年行业不再比拼参数规模了，因为大家都‘悟’了。」不同尺寸的模型具备不同性能，价格自然不同，但豆包是以最终能力最强的主力模型来定价，同时与行业价格进行对比。

在具体优化成本的方式上，谭待披露称，一方面通过技术层面手段将成本做低，如对模型结构进行优化调整。其次是在工程方面将过去的单机推理升级为分布式推理，同时结合对云计算算力的混合调度，通过综合方式将成本做低。

至于为什么要做降价这个市场动作，谭待表示，今年一个很大的变化在于行业大模型能力大幅提升，做应用这件事变得很重要，也就是一定要将生态做繁荣。谭待称目前接触的很多客户都在做大模型方面的尝试，但创新这件事的风险度很高，尤其在AI领域，因此需要将成本降低，拉动大家更广泛地使用起来。从这个角度来讲，不论是大企业还是个人，都需要更低成本、更高质量的大模型。

目前，大模型应用发展仍处于早期阶段。QuestMobile数据显示，截至今年3月，基于大模型的AIGC行业用户量为7380万，尽管同比增长了8倍，也仅占移动互联网用户量的6%。谭待认为，降低成本是推动大模型快进到「价值创造阶段」的一个关键因素。

如今行业内降低大模型价格渐成趋势，昨日OpenAI在进行大模型技术更新的同时，也宣布了价格的下降。OpenAI新推出的两个嵌入模型：text-embedding-3-small模型与text-embedding-3-large模型，前者的价格仅为上一代的五分之一，每1000个tokens的价格从0.0001美元降低到0.00002美元。后者可以创建多达3072维（dimensions）的嵌入，其主要提升在于性能。

另在5月13日，智谱大模型开放平台（bigmodel.cn）上线新的价格体系，入门级产品 GLM-3 Turbo 模型调用价格下调80%，从5元/百万tokens降至1元/百万tokens，1元可以购买100万tokens。面壁智能方面针对大模型降价趋势表示，自身产品小钢炮MiniCPM一直0元购，降无可降。

对于降价这件事，谭待在采访中表示，To B业务通过亏损换收入是不可持续的，所以火山不走这条路，更多考虑的是让更多人来使用，「大的使用量才能打磨出好模型，也能大幅降低模型推理的单位成本。」谭待表示，通过技术手段将价格打下来后，行业便会踊跃进来尝试这件事。

截至目前，字节跳动基于豆包大模型打造了AI对话助手「豆包」、AI应用开发平台「扣子」、互动娱乐应用「猫箱」，以及星绘、即梦等AI创作工具，并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务，用以提升效率和优化产品体验。

字节跳动产品和战略副总裁朱骏认为，技术在快速演化，但用户核心的需求没有改变，包括高效获取信息、工作提效、自我表达、社交娱乐等，字节跳动希望能够找到适合的大模型应用形态。目前豆包是字节跳动重点投入的大模型应用。据朱骏透露，豆包上已有超过800万个智能体被创建，月度活跃用户达到2600万。

豆包大模型在服务字节内部的同时，也在与火山引擎的众多企业客户合作共创，其所提供的是一个有多模态能力的模型家族，目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。

(本文来自第一财经)