AI 大模型商业模式思考
本篇报告,我们通过对海内外 AI 大模型企业的研究,提供对 AI 大模型商业模式的思考框 架: 1 )基础大模型未来的竞争格局方面,或赢者通吃,或国内外分别寡头竞争,而行业 大模型则有望百花齐放; 2 )本轮 AI 应用中,「 AI+ 」还是「 +AI 」能够取胜需要根据场景 具体讨论,取决于 AI 在业务流程中是否具有护城河,以及 AI 在业务价值链的占比; 3 )开 源模型和闭源模型在未来较长一段时间内将形成相互摇摆的博弈格局。
「基础大模型→行业大模型→终端应用」的大模型应用路线日渐清晰
AI 大模型的应用路线日渐清晰,大致途径为「基础大模型→行业大模型→终端应用」。 基础大模型,也称为通用大模型,是通过基于海量通用数据进行预训练而得到的。其优点 在于拥有强大的泛化能力。
基础大模型通常利用大算力和拥有大量参数的深度学习算法, 在大量无标注的通用数据上进行预训练,从而形成能够「举一反三」的泛化能力,相当于 AI 完成了「通识教育」。基础大模型将 AI 的开发应用从「小作坊」带入「大工业」时代, 但由于缺乏特定场景的语料和数据集的训练及模型调优,因此在特定场景下的「专业度」 还有待提高。
行业大模型是在基础大模型的基础上,进一步融合行业数据、知识和专家经验,从而有效 提升模型的表现和可控性。其优点在于更为专业,并对于不同的应用场景具有更强的适配 性。目前,在金融、能源、制造、传媒等领域,已经有部分头部企业与科技公司或科研单 位联合发布了行业大模型。
大模型的竞争者越来越多,既有 OpenAI (未上市)、微软( MSFT US )、谷歌( GOOG US/GOOGL US )、百度( 9888 HK/BIDU US )、腾讯( 700 HK )、阿里( 9988 HK/BABA US )、商汤( 20 HK )等科技企业,又有智谱(未上市)、月之暗面(未上市)等初创企业, 以及英伟达等芯片厂商。随着大模型被越来越多的消费者及企业接受,未来的市场竞争格 局将决定大模型生态系统的发展空间和最终赢家。由于基础大模型与行业大模型存在差异, 这两类大模型最终可能形成不同的竞争格局。 随着大模型在更多应用端的渗透,科技企业关于大模型的军备竞赛已经从基础大模型延伸 到行业大模型。例如,国内的百度文心、阿里通义、腾讯混元、华为盘古等大模型体系中 均覆盖了基础大模型和行业大模型。
开源模型 vs 闭源模型
开源模型异军突起,给闭源模型带来猛烈冲击。海外市场中, OpenAI 和谷歌闭源模型领 先, Meta 凭借开源模型 Llama 系列模型独树一帜;国内市场中,百度、腾讯、阿里等互 联网大厂持续迭代自研闭源模型,同时阿里通义千问 7B 、 GLM - 130B 、书生浦语 7B 、百 川 13B 等模型宣布商业开源。 我们认为,随着以 Llama 为代表的高性能开源大模型的出现,对于垂直行业应用公司来讲, 从头训练大模型的模式的意义正在下降,我们已经看到部分垂直应用公司转而采取开源模 型 + 矢量数据库的形式,解决特定应用场景和问题。开源模式将蚕食闭源模式一定的市场 份额,两者在未来较长一段时间内或将形成相互摇摆的博弈格局。
以 Llama 为代表的的前沿开源模型性能优异。 以 Meta 2024 年 4 月发布的 Llama 3 为例, 其分为大中小三个版本,相比其他模型:小规模的 8B 模型效果比同类大小的模型 Mistral 7B 、 Gemma 7B 略好或基本持平;中等规模的 70B 模型效果比 Gemini Pro 1.5 、 Claude 3 Sonnet 略好或相当,并超过 GPT - 3.5 ;最大的 400B 模型仍在训练过程中,设计目标是 多模态、多语言,根据 Meta 公布的目前训练数据,其性能与 GPT - 4 相当。
开源大模型具备低成本高效落地、技术迭代迅速以及可私有化部署的属性,解决闭源大模 型应用痛点。 1 )低成本高效落地:模型从头训练需要大额资金投入,使用闭源大模型在 企业用户量攀升后 Token 费用将水涨船高;而开源大模型可以帮助用户简化模型训练和部 署过程,并节省高额初始及后期资金投入,用户只需从开源社区如 HuggingFace 中免费下 载预训练好的模型并进行微调,就可快速构建高质量的模型。 2 )技术迭代迅速:在 Llama 2 、 Llama3 开源发布后,吸引了全球开发者和爱好者参与开发和改进,当前已快速 衍生出一系列开源的基础模型与行业模型,这极大地加快了创新和迭代的速度。 3 )私有 化部署:如果把行业的 know - how 数据输送给闭源大模型,可能存在数据泄露的风险;而 开源大模型可部署在企业内网的 AI 服务器上,帮助企业保护敏感数据安全性。
开源模式的任何渐进式改进都在蚕食闭源模型的市场份额,未来两者或在相当长一段时间 内形成互相博弈和竞争的格局。部分原计划用闭源大模型如 GPT - 4 的垂直应用公司,可能 会迫于成本、定制开发等原因,转而选择 Llama 或其他开源模型。另外,开源也能让其他 新加入者更快适应 AI 产业,未来一天或几天之内的训练周期将成为常态,以这样的速度, 微调的累积效应将很快帮助小模型克服体量上的劣势。开源模型和闭源模型各有所长,二 者将长期共存:
1 )模型方面,闭源大模型的质量更高,例如 Llama 2 - 70B 在代码生成上 与 GPT - 3.5 仍有显著差距。且快速迭代的开源模型数量庞大,对用户而言选择成本随之上 升; 2 )安全性方面,闭源大模型的可靠性更有保障。部分客户如大型政企,在大模型采 购时往往需要大公司的品牌作为可靠性背书。
3 )产业化方面,闭源大模型的长期服务能 力更强、更可用。大模型与业务结合,需要产品、运营、测试工程师等多种角色共同参与, 同时大模型的长期应用所需的算力、存储、网络等配套都要跟上,开源社区无法帮助用户 「一站式」解决这些细节问题。
因此,这场博弈将在未来引导着开源、闭源两种模式不断 进行改进,模型产业化应用将成为两种模式的试金石。 此外,面对性能优异的 Llama 及其快速增多的衍生开源模型,部分 AI 初创企业可能正在 失去存在的意义,市场内自研模型的公司数量或将快速收敛,除了科技巨头外,只有少数 具备先发优势的 AI 初创企业能够在激烈的竞争中生存下来。
AI+ 还是 +AI :关注 AI 是否具有护城河及全业务流程价值链占比
「 AI+ 」(以 AI 技术赋能行业的科技企业)还是「 +AI 」(采用 AI 技术的传统企业)能够胜 出是上一轮 AI 投资最大的争议。 「 AI+ 」是以 AI 技术为核心,重构现有业务;「 +AI 」是以 现有业务为核心,借助 AI 降本增效,是改进而非重建。从结果来看,「 AI+ 」企业在智慧 城市等特定领域获得商业成功,但互联网(例如谷歌、百度的搜索,头条的推荐,阿里的 广告)、金融等行业通过已有业务 +AI 提升了效率。我们认为上一轮「 AI+ 」企业没有全面 成功的原因是算法的进入壁垒相对较低。 本次大模型主导的创新周期相比上一轮以国内 AI 四小龙(商汤、旷视、云从、依图)为 代表的 AI 浪潮主要有三点区别:
1 )大模型能力更强。预训练大模型算法架构更先进,训 练消耗的数据量和算力跃升,因此泛化能力更强。 2 )应用落地更明确。生成式 AI 在许多 领域成为了生产力工具。 3 )商业模式更清晰多样。上一轮 AI 浪潮, AI 公司采用小模型 + 软硬结合的定制化解决方案变现,偏通用化软件化的 API 和 SaaS 并未成为主流的变现方 式。本次创新周期中, ToC 的订阅费、 ToB 的 API 调用费成为主流的变现手段, ToB 的 MaaS 商业模式也逐渐清晰。
在当前大模型主导的创新周期中,大模型的应用模式仍然是许多企业关注的焦点。企业需 要决定是选择「 AI+ 」(以 AI 技术为核心,重构现有业务)还是「 +AI 」(以现有业务为核 心,借助 AI 降本增效)?我们认为,对于大模型应用模式的选择可以从两个方面考虑: 首先,要考虑 AI 在企业全业务流程价值链中所占比例。 如果 AI 在该赛道全业务流程价值 链中所占比例很小,比如只有 10% ,则更容易从「 +AI 」切入。因为要从「 AI+ 」切入,企 业需要先将剩下的 90% 业务补足,而在产业链深耕多年的竞争对手很可能已经补足了这 90% 。
相比之下,如果 AI 占据全业务价值链的较大比例,「 AI+ 」将有更大的发展空间。 例如,在电商领域,可能更适合从「 +AI 」切入。因为即使没有 AI 技术,商家仍然可以通 过提供更优质的产品和服务来取胜。这是因为 AI 在电商全业务价值链中所占比例较低,而 用户、渠道和产品等因素更为关键。大模型在电商领域更多地用于降低成本和增加效率, 例如自动生成营销文案、图像快速检索和智能语音客服等,我们将在下一节进行详细阐述。
其次,要考虑企业业务中 AI 是否具备护城河。 如果 AI 在业务中没有护城河或者门槛很低, 选择「 +AI 」更适合持续发展。因为一旦传统企业认识到 AI 的价值,也开始采用「 +AI 」 策略,其他企业很容易赶上来。在这种情况下,创业公司选择「 AI+ 」可能难以生存。相 反,如果 AI 在业务中形成了较高的护城河,「 AI+ 」也许会产生创业机会。即使 AI 只占全 产业链的一小部分,比如 30% ,但这 30% 却具有非常高的门槛。后来进入市场的传统企 业即使在其余 70% 上取得优势,也难以突破这 30% 的高门槛。
因此,提前入局并占据了 30% 份额的企业仍能持续经营,这也是「 AI+ 」模式的机会所在。 在蛋白质结构预测领域,采用「 AI+ 」模式可能会取得突破性进展。蛋白质的功能很大程 度上取决于其 3D 结构,而预测蛋白质的 3D 结构是一个非常复杂的过程。以前,计算所 有可能的折叠方式需要耗费极长的时间。然而, AI 大模型为蛋白质结构预测提供了新的解 决方案。例如, DeepMind 从 2016 年开始研究,在 2018 年发布了 AlphaFold ,然后在 2020 年推出了 AlphaFold 2 ,在蛋白质结构预测大赛 CASP14 中取得了原子水平的准确度, 将运算时间从数月缩短至数小时,有助于加快药物研发。蛋白质结构预测的大模型门槛很 高,目前行业内的企业数量较少。
本轮「 +AI 」和「 AI+ 」都可能获得可观的价值,「 +AI 」赋能众多传统业务,「 AI+ 」更可 能重塑行业。 对于「 +AI 」, 1 )传统行业众多,意味着「 +AI 」的落地场景众多; 2 )传统行业体量大, 赋能的新增价值将产生规模效应,例如一家银行或一家造车公司,如果 AI 可以帮其 3 - 5% 的效率,就能产生较为可观的价值; 3 )关注更易与 AI 结合的传统业务及其龙头企业,比 如电商的阿里和京东、办公软件的微软和金山办公等,因为有自身发展需求、具备商业价 值的海量数据,我们认为积极拥抱 AI 技术等特质的传统企业更可能考虑 +AI 。 对于「 AI+ 」, 1 )算力、算法、数据等壁垒较高,有较高的进入门槛,先发优势明显; 2 ) 在数据更私密、算法壁垒更高、定制化程度较高的自动驾驶等关键领域,「 AI+ 」公司有机 会深耕并占据细分赛道的领先地位。
搜索、电商、营销「 +AI 」
我们认为,搜索、电商和营销是目前「 +AI 」较有代表性的场景。 AI 提升了生产力并改进 了用户需求。其应用场景涵盖文本编写、图像生成、智能交互、产品定义开发与营销的全 流程,从多个维度重塑了生产力格局。
搜索:信息搜索、内容生成
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进 行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。 搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理 技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。 传统的搜索行为往往需要经历长时间的判断过程和多轮的互动,无法直接且有针对性的回 答用户的问题、无法生成新的内容或进行摘要总结、难以支持长文本搜索,难以实现搜索 与其他功能的串联。 展望未来,我们站在了新一轮搜索引擎迭代的起点。 AI 技术与搜索引擎的不断融合,将从 底层结构上改变搜索形态,过去的搜索引擎重点在于检索已有信息,而以 GPT 为代表的 大模型加持将让搜索引擎拥有生成内容的能力,带来全新的对话体验,为用户提供个性化 的回答和对话服务,具体体现在以下两个方面:
1 )创造性内容生产与输出, AI 大模型可以利用大量实时文本数据学习语言的规律,并根 据用户指示创造性地完成特定需求下各种类型的文本输出,如故事、诗歌、摘要、代码等。 2 )拓展搜索的多模态能力,利用 AI 技术处理视频、图片、语音等多种形式的信息,使搜 索不再受限于信息的形态。 AI+ 搜索的诞生便吸引了全球的注意力。但与此同时, AI 生成内容的准确性、可靠性也受 到了一定的质疑。
New Bing :是 2023 年 2 月微软推出了基于 GPT - 4 的搜索引擎。 New Bing 不仅更加智能 和准确,而且在回答问题时不仅限于文本形式,还可以包含图像、视频、音频等多种形式。 此外, New Bing 的侧边栏功能也非常实用,可以直接在 Bing 搜索页面进行聊天和撰写, 无需切换窗口和标签页,并且可以引用实时网络数据回答问题。内置 AI 聊天功能的 New Bing 搜索引擎在推出一个月后日活跃用户已突破 1 亿。
Bard : 2023 年 2 月,谷歌推出了基于 LaMDA 大模型的 AI 对话机器人,名为 「Bard」 。这 款聊天机器人于 2023 年 3 月 21 日向公众开放访问权限。 Bard 是基于 LaMDA 的轻量级 版本,使用更少的计算能力,因此可以覆盖更多用户并提供额外的反馈。谷歌还在 I/O 开 发者大会上发布了大语言模型 「"PaLM2」 ,该模型将驱动聊天机器人 Bard 。经过升级后, Bard 将支持超过 20 种编程语言,并面向全球用户开放。
文心一言 :是百度推出的一款基于百度新一代大语言模型的生成式 AI 产品,于 2023 年 3 月 16 日正式发布,于 3 月 27 日上线。文心一言拥有产业级知识增强文心大模型 ERNIE , 具备跨模态、跨语言的深度语义理解与生成能力,文心一言有五大能力,文学创作、商业 文案创作、数理逻辑推算、中文理解、多模态生成。
电商:产品开发、产品营销、产品售后
零售的核心是人、货、场。整个零售包括产品开发、产品营销、产品售后等环节。 回顾过去,从线下百货商店到线上电商平台,互联网通大数据精准推送目标客户,通过产 业链数字化缩短售后步骤、时间,通过海量用户反馈反哺产品开发环节,优化产品设计。 展望未来, AIGC 利用自然语言处理、机器学习和深度学习等工智能技术,能够自动创建 各种形式的内容,如文字、图像、音频和视频等。这使得 AI 与电商行业的需求深度结合, 涵盖了产品开发、产品营销和产品售后等各个阶段,为电商平台带来全方面的降本增效。 在产品开发阶段, AI 可以提供设计灵感、定制化产品描述和优化产品决策。
AIGC 分析市 场趋势、消费者喜好和竞争对手的产品,为电商提供设计灵感和创意方向。同时,以 Midjourney 为代表的 AIGC 可以根据需求和特定目标群体,定制生成产品描述和配图,自 动生成吸引人的产品描述和高质量的配图,帮助电商展示产品的特点和优势。此外, AIGC 基于市场信息对产品价格、目标群体等要素进行分析,为电商提供优化建议和方案, 帮助其调整产品定价和推广策略。
在 2021 年 4 月,海外电商领军企业亚马逊首次推出了官方 AI 选品工具,利用超过 600 个 数据维度,个性化预测卖家在不同国家销售产品的全球需求。吉宏股份( 002803 CH )自 2023 年 1 月起广泛采用 AIGC 技术,深入挖掘产品的优缺点,深度分析客户的购买动机, 进一步优化选品决策,目前已累计帮助公司上新了 1 万多个新品。
在产品营销阶段, AIGC 能够实现广告智能投放和虚拟主播带货。在广告智能投放方面, AIGC 通过分析用户数据、行为和兴趣,预测他们的购买行为,并有针对性地投放广告。 这个过程包括广告创意制作、投放时机和选择投放渠道等方面。通过 AIGC 的智能投放, 广告可以更准确地触达目标受众,提高广告的转化率,降低投放成本。在虚拟主播带货方 面,通过使用 AIGC 技术,可以让虚拟主播根据商品特点和用户需求,自动生成相应的推 荐语言和图像,实现更加精准的推荐和销售。这种模式不仅提高了效率,还可以节约人力 和成本,同时增强用户体验。 在产品售后阶段, AIGC 能够实现智能客服售后和自动化订单管理。
智能客服为电商平台 提供更高效和智能化的客户支持。通过自然语言处理和机器学习等技术, AIGC 能够理解 和解答用户的问题,并提供准确的解决方案。它可以处理常见的售后问题,如订单跟踪、 退换货流程、产品使用指导等,并提供个性化的客户服务。此外, AIGC 还可以实现订单 管理的自动化。例如, Shopify 应用商店中的 ShipStation 工具就通过自动化处理订单管理 流程,包括仓储、发货、物流等环节, AIGC 能够大大提高电商平台的操作效率和准确性。 它可以自动处理订单的确认、配货、打印运单等操作,减少人工干预的时间和错误。
营销:广告文本编写、生成虚拟人物
AI 技术在营销领域发挥了重要作用,提升了信息传递效率,并大幅提高了营销内容的生产 效率。这些改进使得广告媒体能够从收入端提高广告媒体的营收规模,同时营销服务商也 从成本端提高了毛利率。 具体来说, AI 技术提高信息传递效率有两个主要原因。首先,通过个性化推荐, AI 可以根 据用户的历史浏览记录、兴趣爱好、购买记录等数据进行分析,从而推荐个性化的广告内 容。这样可以更好地吸引用户的注意力,并更加精准地传递信息。其次, AI 技术可以帮助 企业在多个渠道进行广告投放和营销,实现更全面的覆盖,从而提高信息传递效率。 AI 技术提高营销内容的生产效率也有两个主要原因。
首先,通过自动化生成, AI 可以自动 化生成广告文案、图像素材、视频内容等,大大减少了人工制作的时间和工作量。通过使 用 AI 生成的工具和系统,营销人员可以快速生成大量优质内容,提高信息的生产效率。其 次,数据驱动的创作让 AI 利用大数据分析和机器学习算法深入挖掘用户行为和偏好数据。 这为营销人员提供了更准确的创作方向和内容主题。通过分析用户数据, AI 可以帮助营销 人员更好地理解受众需求,精准定位目标用户,并根据用户反馈不断优化内容,提高信息 的生产效率。
例如, Copy.ai (未上市)是一款基于人工智能技术的文本生成工具,利用 90 多种工具和 模板帮助用户快速生成各种类型的文本内容,如广告语、博客文章、产品描述、社交媒体 帖子等。通过使用 Copy.ai ,营销人员可以节省大量的时间和精力,快速生成高质量的文 本内容。此外, Copy.ai 还可以基于用户提供的关键词和语境生成针对性的文本内容,帮 助营销人员更好地传达信息。 Rosebud AI (未上市)是一家专注于人工智能生成图像的技术公司。他们的主要产品是 一个基于 GAN 技术和自然语言模型 GPT - 3 技术的面部合成引擎,可以根据用户提供的指 示生成高度逼真的人脸图像。
Rosebud AI 的技术能够生成虚拟的商品模特面孔,从而实现 个性化的营销。通过使用 Rosebud AI ,营销人员可以根据特定的目标群体和品牌需求,自 动生成适合的商品模特图像,以吸引目标消费者的注意力并增加购买意愿。据 Rosebud 称,利用该产品生成商品模特的第一个活动获得了 22% 的点击率提升。这种个性化的营销 手段可以提高品牌的影响力和产品的营销效果。 Rosebud AI 的技术在时尚、美妆、电子商 务等行业中得到广泛应用,并为营销人员提供了创新的工具和方法来推动营销活动的成功。 到 2021 年,该公司已提供了超过 25,000 张不同的虚拟人建模图像。
附录:国内外主流 AI 大模型
对比国内外主流 AI 大模型,我们发现以下趋势: 1)开源 vs 闭源:2023 年初,主流闭源大模型通常为纯文本的 LLM。2023 年至今,闭源模型的多模 态能力具有大幅度提升,目前主流闭源大模型通常具备图像理解、图像生成能力。如图 5 所示,虽 然开源模型的文本能力有了较大提升,但大多数开源模型尚不具备多模态能力。 2)国内 vs 海外:23 年底以来更新的国内主流大模型开始对标 GPT-4。例如 2023 年 10 月更新的文 心 4.0(Ernie 4.0)「综合水平与 GPT4 相比已经毫不逊色」,2024 年 1 月更新的智谱 GLM-4 整体性 能「逼近 GPT-4」,2024 年 4 月更新的商汤日日新 5.0「综合性能全面对标 GPT-4 Turbo」。
精选报告来源:幻影视界