当前位置: 华文世界 > 科技

2024年2月14日 人工智能领域(AI)信息差

2024-02-14科技

「更多的agents = 更好的性能」 - 腾讯研究团队

腾讯研究团队发布了一篇论文,声称通过增加代理的数量可以显著提高语言模型的性能。研究人员使用了一种「抽样和投票」的方法,将输入任务多次输入到具有多个语言模型代理的语言模型中,以产生结果。然后,对这些答案进行多数投票,确定最终答案。

研究人员通过对不同数据集和任务进行实验来证明这种方法,结果显示语言模型的性能随着集合的规模增加而提高,即随着代理数量的增加(下图为结果)。他们还证明,通过扩大代理数量,即使是较小的语言模型也可以与较大的语言模型相匹配/超越。

使用多个代理来提升语言模型的性能是一种应对单一模型固有限制和偏见的新策略。这种方法消除了复杂的方法,如思维链提示的需求。虽然它不是万能药,但可以与现有的复杂方法相结合,激发语言模型的潜力并增强它们以实现进一步的性能改进。

谷歌DeepMind的MC-ViT能够理解长篇视频

来自谷歌DeepMind和康奈尔大学的研究人员合作开发了一种方法,使基于人工智能的系统能够更好地理解长篇视频。目前,由于复杂性和计算能力的限制,大多数基于人工智能的模型只能理解短时间的视频。

这就是MC-ViT的作用所在,它可以存储过去视频片段的压缩「记忆」,使模型能够高效地参考过去的事件。这种方法结合了神经科学和心理学,受到了人类记忆巩固理论的启发。尽管使用的资源较少,MC-ViT方法提供了最先进的动作识别和问题回答能力。

大多数基于transformers的视频编码器在处理长序列时都会遇到困难,因为它们的复杂性。解决这个问题的努力往往会增加复杂性并降低速度。MC-ViT提供了一种更简单的处理长篇视频的方法,而无需进行重大的架构更改。

ElevenLabs是一个让你的声音变成被动收入的平台。

ElevenLabs开发了一个AI语音克隆模型,可以让你的声音变成被动收入。用户需要注册他们的「声优收益」计划。

创建账户后,上传一个30分钟的音频,包含你的声音。克隆模型将使用AI创建一个与你原声相似的专业声音克隆。然后你可以将其分享到声音库中,让ElevenLabs的不断增长的社区使用。

之后,每当有人使用你的专业声音克隆时,你将根据你的要求获得现金或角色奖励。你还可以选择标准版权计划或设置自定义费率来决定你的声音使用费。

通过利用ElevenLabs的AI语音克隆技术,用户可以以多种方式将他们的声音变现,例如为有声书提供旁白,为虚拟助手配音,甚至将他们的声音用于广告活动。这种创新使声优行业民主化,使其不仅仅局限于专业演员和配音艺术家,而是让更广泛的受众可以参与其中。此外,这也反映了人工智能在重塑传统行业方面的日益影响力。

其他消息

NVIDIA首席执行官黄仁勋倡导各国拥有自主的人工智能

在迪拜世界政府峰会上发言时,NVIDIA首席执行官强烈倡导拥有自主的人工智能。他说:「每个国家都需要拥有自己的智能生产。」他进一步补充道:「这将使你的文化、社会的智慧、常识和历史得到编码 - 你拥有自己的数据。」

Google将在欧洲投资2500万欧元以提升人工智能技能

Google承诺投资2500万欧元来帮助欧洲人民学习如何使用人工智能。通过这笔资金,Google希望开发各种社会企业和非营利应用。这家科技巨头还计划开设「增长学院」,以支持使用人工智能扩大规模的公司,并将其免费在线人工智能培训课程扩展到18种语言。

NVIDIA市值超过亚马逊

NVIDIA公司在周一的市值中暂时超过了亚马逊公司。NVIDIA股价上涨近0.2%,收盘市值约为1.78万亿美元。而亚马逊股价下跌1.2%,收盘市值为1.79万亿美元。凭借这个市值,NVIDIA公司暂时成为美国上市公司中市值第四大的公司,仅次于Alphabet、微软和苹果。

微软可能为Windows 11开发一项人工智能升级功能

微软可能会在Windows 11上为PC游戏推出一项人工智能升级功能,类似于NVIDIA的深度学习超采样(DLSS)技术。最新测试版本的Windows 11中,一位用户发现了名为「自动超分辨率」的功能,它使用人工智能来提高支持的游戏的帧率和图像细节。微软尚未宣布这一消息或硬件细节,如果有的话。

Fandom推出具有争议的生成式人工智能功能

Fandom为许多粉丝群体提供维基,并推出了许多生成式人工智能功能。然而,一些功能,如「快速回答」,引发了争议。快速回答会生成一个问答式下拉菜单,将信息浓缩成简洁的句子。维基创建者抱怨它不准确地回答了粉丝的问题,从而损害了用户的信任。

原文:https://theaiedge.substack.com/p/more-agents-better-llm-performance