当前位置: 华文世界 > 科技

火山引擎连发两款视频大模型,推动AI普及

2024-10-05科技

火山引擎连发两款视频大模型,推动AI普及

一日连发两款视频大模型,火山引擎要让每个人都能用上AI

2023年9月24日,字节跳动旗下的火山引擎在深圳举办了AI创新巡展,首次推出了豆包视频生成模型PixelDance和Seaweed。同时,火山引擎还宣布了多项AI大模型的升级,以全新的姿态迎接AI时代的来临。

此次巡展吸引了众多参观者,现场设有四个不同的展示区,分别展示了AI奇遇、AI音乐、AI智能助手和AIBot等四大应用,涵盖了娱乐、创作、问答和个性化AI需求等领域。这些应用反映了AI技术在C端的广泛应用和用户需求。

其中,AIBot引起了广泛关注。该平台利用AI大模型的理解能力,帮助用户开发个性化的AI应用,用户无需编程知识,只需明确需求,AI便可自动完成开发过程。这种便捷性使得普通用户能够轻松使用AI技术,推动了AI应用的普及。

用AI打破视频创作边界

在视频创作领域,火山引擎无疑是行业的领先者。借助抖音引发的全球视频创作热潮,火山引擎致力于提升用户在实际创作中的体验,着重优化创作流程和效果。通过大量的技术优化,他们的豆包视频生成模型旨在为用户提供接近实际拍摄效果的画面。

此外,火山引擎还在AI视频创作中解决了多个痛点,例如多动作指令互动和人物中途插入的自然衔接。这种复杂场景的处理使得AI在创作中更加灵活和真实,为普通用户提供了更高的创作自由度。

为了满足多样化的创作需求,火山引擎还引入了深度优化的Transformer结构,使豆包视频生成模型能够支持多种风格的生成,包括3D动画、国画等。这些升级将为各个领域的创作者提供更好的工具,鼓励他们自由表达创意。

豆包AI模型Pro升级

除了豆包视频生成模型,火山引擎还宣布了豆包通用模型和音乐模型等多个AI大模型的升级,旨在为用户提供更丰富的应用体验。在AI音乐方面,火山引擎展示了其快速生成音乐的能力,用户只需提供简单的要求,系统便能快速生成一首旋律动听的曲子及其歌词。这一过程的简便性,实际上是火山引擎在音乐模型优化中取得的显著成果。

火山引擎利用独特的音乐生成架构和解码模型,使得音乐生成的时间缩短至秒级,呈现出更为真实的演唱效果。现场许多嘉宾在聆听后表示,若不告知是AI创作的,或许会误认为是新晋歌手的作品。这表明火山引擎在AI创作领域已经克服了多项技术难关。

火山引擎在现场还展示了数字人生成应用,用户可以在短时间内生成一个具有拟真表情和语气的数字人。这种应用广泛适用于直播、在线教学及智能客服等场景,标志着火山引擎在多领域AI应用方面的突破。

结合数字人和同声传译模型,火山引擎为海外市场的主播提供了新的解决方案,满足了日益增长的多语种直播需求。这一策略为火山引擎的市场扩展带来了新的可能。

让所有人都能用上AI

为了适应AI模型需求的迅速增长,火山引擎不断提升大模型的承载能力。豆包大模型的默认并发流量标准已提升至800KTPM,远超行业普遍标准。同时,火山引擎也降低了算力成本,其定价已低于行业99%。这一变化有效地降低了开发者的进入门槛,推动了更广泛的AI应用生态形成。

火山引擎的CEO谭待指出,降低算力成本不仅是为了应对当前市场需求,更是为未来的AI发展打下坚实基础。通过优化技术架构,他们能够以更低的成本提供更高质量的服务,保持技术的领先优势。

谭待对豆包视频生成模型的未来充满信心。他认为,豆包模型依托于多个技术成果,因此在技术挑战上已经做好准备。同时,火山引擎将继续优化视频生成模型的效率,使其尽快面向市场,满足日益增长的用户需求。