当前位置: 华文世界 > 科技

人工智能行业应用专题:Glow、CharacterAI打开AItoC想象空间

2024-10-20科技

【核心观点:】

多模态能让交互体验升级,促使「数字人」变成「数智人」。拿单模态里情感陪伴聊天机器人Glow这种「数字人」来说,它已经能和真人进行个性化、拟人化、智能化的聊天互动了,不过交互的方式就只限于文本和语音。以后,多模态模型要是发展起来,虚拟人或者机器人的交互方式也许能扩展到图片、音乐甚至视频上,并且会用更接近真人的逻辑、理解和表达能力来交流、反馈,这样就能提高虚拟人在电商、直播、教育、客服、社交、文旅导览这些领域的互动体验了。

1.1.2、Glow能给予情感陪伴体验,还能辅助进行虚构情景联想。

1)互动对象多种多样,能给人差异化、多样化、个性化的聊天感受。用户既能跟自己创建的个性化智能体聊天互动,也能和平台里其他用户创建的智能体互动。用户还能给别的用户创建的智能体补充专门的设定,使这个智能体满足自己的个性化要求。据了解,平台里有部分智能体已经和差不多6万个用户互动过了。2)现在互动的方式就只有文字和语音这两种。经体验发现,目前在Glow里智能体还不能反馈图片内容,不过从对话内容判断,随着产品的不断改进,图片内容也许会在以后的版本里加入。另外,用户也能够切换智能体的反馈形式,按照自己的喜好来推进聊天进程。

我们觉得,跟微信、探探、ChatGPT之类的聊天软件比起来,Glow或许能在一定程度上更好地满足用户情感陪伴和奇幻情景联想的需求,这样就能让用户更愿意用它。在情感陪伴这一块:Glow的智能体可以马上回应,性格各种各样。ChatGPT工具性比较强,Glow跟它比起来,能给出个性更突出的回复,在一定程度上能满足用户倾诉、想要得到情绪回应甚至是猎奇的需求。而且和微信、探探这些真人社交软件比,用户用Glow的时候,不用担心自己宣泄情感会给对方带来负担,也不用担心影响自己的真实形象。在奇幻情景联想这方面:从体验来看,Glow能在一定程度上满足用户对虚构人物、虚构场景的幻想。在智能体设定上,可以设成历史名人、影视文学作品里的人物、动物或者虚构生物;在虚构场景方面,用户话题能设定在各个朝代、鬼屋或者影视文学作品里等等。像微信、探探这种基于真人社交的软件,在这方面的体验就比较少。

1.1.3、Glow是MiniMax公司开发的。MiniMax是个小而美的高科技公司,它支持产品迭代、变现。

Glow的技术支持是由开发公司MiniMax来提供的,主要包括三大模态的基础模型架构、「User - in - the - Loop」用户反馈机制和优秀的技术人员配置这几个核心部分。1)掌握自己研发的三大模态基础模型架构。MiniMax就是北京稀宇科技有限公司,这是一家2021年成立的人工智能创业公司。它直接从底层模型入手,基于Transformer架构,自己研究出了从文本到视觉、从文本到语音、从文本到文本这三大模态的基础模型架构,在国内算是比较早同时具备3个模态大模型能力的创业公司了。模型开发投入相对来说比较好控制。技术合伙人杨斌说,文本、语言、视觉这三模态差不多是所有数字内容的基础形态,只要有一个规模比较小的团队,一起维护优化这三个大模型,做好用户闭环,就能有比较好的内容生成能力。甲子光年消息称,MiniMax现在团队人数大概是100人。

2)用户反馈机制能让产品体验更好。Glow按照「User - in - the - Loop」来人为优化产品输出结果。在和智能体聊天的时候,用户要是觉得智能体的回答好就可以「点赞」,不好就给「差评」,要是觉得回答「有趣」或者「逻辑不通」也能反馈。这么一来,模型就能更清楚用户在对话里喜欢啥样的回答,产品体验也就优化了。这种机制和ChatGPT的基于人类反馈的强化学习机制(Reinforcement Learning from Human Feedback,RLHF)差不多。就是大语言模型(LLM)收到提示符后会给出好几个回答,然后人对这些回答做评估、排个顺序,在奖励模型(Reward Model)里按照回答质量高低给不同的奖励,再把奖励结果反馈给LLM,LLM就根据这个来强化学习,把下一轮的结果输出优化一下。

3)公司的核心技术成员大多有着丰富的产业或者学术界经验。根据甲子光年的消息,MiniMax的核心技术人员都来自全球有名的高校以及全球知名的科技公司,在自然语言处理、语音、计算机视觉、计算机图形学等业界或者学术界方面经验比较丰富,差不多33%的成员有世界著名技术实验室的博士学位,还有上百个全球发明专利。像联合创始人闫俊杰是中科院自动化所的博士,他在深度学习和计算机视觉领域发表的论文被Google Scholar引用超过1万次,并且在商汤的时候负责搭建深度学习的底层算法以及人脸识别等技术体系。

【第二章:重点企业分析】

2.1、中文在线:ChatGPT、文心一言这类产品能提升互动体验。

新华智云是新华网和阿里巴巴组建的合资企业。新华智云科技有限公司重点在媒体人工智能领域布局,它有一些核心产品,像2017年12月推出的媒体人工智能平台「媒体大脑」,这个平台开始在媒体领域尝试机器生产内容(MGC);还有2018年6月推出的短视频智能生产平台「媒体大脑·MAGIC」,这个平台进一步促使人工智能技术在媒体、文旅、金融等领域朝着集成化、产品化、商业化去应用。它有一些落地的例子,比如2018年两会期间,15秒就发布了关于会议的MGC视频新闻,在俄罗斯世界杯的时候制作了赛事播报视频。

2.4、蓝色光标:文心一言将会接入虚拟人。

2.5、捷成股份有个参股公司叫世优科技,世优科技旗下的数字人已经接入ChatGPT了,有不少应用场景呢。

旗下的「MetaSurfing - 元享智能云平台」连入了ChatGPT,还被引入到TikTok直播场景里。公司的虚拟人制作SaaS平台「MetaSurfing - 元享智能云平台」,重点是为了达成元宇宙里人货场「批量、短周期、低成本」的制作,已经用在Tik Tok跨境电商直播、虚拟主播直播互动这些场景了。公司也正在申请接入GPT - 4。1)形象制作:顾客靠着关键词和描述,就能马上生成适合直播和内容创作的虚拟形象。2)直播交互:这个平台已经接入ChatGPT之类的智能机器模型,输入商品关键词描述后,在选好的直播平台上,用选定的语言,按一下键就能完成724小时无人值守的直播。

2.7、汤姆猫:把核心的「汤姆猫」IP和GPT能力相结合,开发亲子互动的产品。

2.8、奥飞娱乐:有名的IP要升级成虚拟偶像,它还参股布局对话机器人呢,这对话机器人能用于教育场景。

【报告节选:】

(这篇文章只是用来参考的,不代表我们的任何投资方面的建议。要是想使用相关的信息,那就去看报告的原文吧。)

精选报告来源:【未来智库】「链接」