当前位置: 华文世界 > 科技

AI 风云:10 月 27 日 AI 圈大事件

2024-10-28科技
AI 领域的巨头们不断推陈出新,以引领行业发展潮流。

(一)OpenAI 的神秘新模型

OpenAI 被曝 12 月推出 Orion,引起了广泛关注。据报道,OpenAI 的高管曾透露 「Orion」 要比 GPT - 4 强大 100 多倍。OpenAI Japan 首席执行官长崎忠雄也表示,GPT Next 预计会有更大的飞跃,性能将提高 100 倍。虽然在 OpenAI 内部,Orion 被视为 GPT - 4 的继任者,但尚不清楚公司是否会在外部称其为 GPT - 5。目前,OpenAI 尚未就此事作出明确回应,但这一消息已经在行业内引发了热议。

(二)谷歌的激烈竞赛

谷歌在 AI 竞赛中也不甘示弱。消息称谷歌计划 12 月发布 Gemini 2.0 模型。尽管最新报告指出,Demis Hassabis 领导的团队未能在新模型中实现预期的性能提升,但该模型仍受到广泛关注。谷歌宣布 Gemini 应用团队将并入 DeepMind,计划将产品分别面向开发者与终端用户推出。此外,谷歌可能最早在 12 月预览其对 Rabbit 大型动作模型概念的诠释,代号为 「Project Jarvis」 的项目将为用户执行任务,包括 「收集研究资料、购买产品或预订航班」。Jarvis 由未来版本的谷歌 Gemini 提供支持,仅在网络浏览器中工作,特别针对 Chrome 进行了优化。

(三)Meta 的新闻合作

Meta 与路透社签署了人工智能协议,这是 Meta 在人工智能时代促成的第一笔新闻业务相关的交易。Meta 的人工智能聊天机器人将引用路透社的报道回答新闻相关问题。从周五开始,美国 Meta 公司人工智能聊天机器人功能的用户在询问有关新闻或时事的问题时,可以获得路透社的实时新闻和信息。路透社将因其内容出现在 Meta 的 AI 聊天机器人中而获得报酬。这一合作将有助于确保为那些寻求时事信息的人提供更有用的体验。

二、技术突破点亮未来

AI 技术的不断突破,为未来带来了无限可能。

(一)仿生机器人的独特魅力

波兰 Clone Robotics 公司推出的仿生机器人 Torso 令人瞩目。这款机器人采用创新的人造肌肉技术,其核心由模制碳纤维骨头制成,其余部分全由软组织构成,包括韧带、肌腱、静脉、脂肪、结缔组织等。它的动力系统包括一个电液泵和一个能存水的容器,电液泵就像人的心脏一样,可以为肌肉提供动力,让肌肉收缩和放松。Torso 的手部设计也十分独特,名为 Clone Hand 的机械手是世界上最接近人类肌肉骨骼结构的机械手,由该公司特制的液压肌肉和阀门驱动。它有 24 个可以动的地方,能像人的手指和手腕那样弯曲和转动,所用的材料是公司自己研发的一种聚合物,比金属轻,但更结实柔软。手里面装了 37 条特殊的肌肉,叫做 McKibben 肌肉,收缩起来只需 0.3 秒,可以快速灵活地做动作。Torso 动作灵活性极高,脑袋可以上下左右转动,肩膀到指尖的每个关节都能活动,可以凹出各种造型,为执行更精密的操作,比如拿手术刀、打针等提供了可能。

(二)动作捕捉工具的革新意义

Runway 推出的 AI 视频生成工具 Act-One 具有重大的革新意义。在面部表情捕捉方面,Act-One 能够使用任何视频摄像头,包括内置于智能手机中的摄像头,来录制自己或演员的面部表情,并以极高的精确度将这些表情映射到 AI 生成的角色上。这一功能极大地简化了动画制作过程,传统上制作面部动画是一个既复杂又繁琐的过程,涉及到动作捕捉设备、手工面部绑定和多角度的参考影像,而 Act-One 让用户只需提供一段简单的视频,就能将表演中的各个细节转移到一个或多个风格迥异的 AI 生成角色之上。同时,Act-One 在各种摄像机角度下呈现电影级的真实感,能够在多变的摄像机角度和不同的焦距下,创造出具有电影质感的真实画面,为视频叙事带来了更广阔的能力。用户仅需一台普通的消费级相机,一位演员就能够表演多个不同的角色,Act-One 能够为每个角色创造出独一无二的表现,为独立电影和数字媒体领域的创作者提供了前所未有的便利。

三、工具创新拓展可能

AI 工具的不断创新为各个领域带来了前所未有的新机遇。

(一)语音定制的新纪元

ElevenLabs 推出的语音定制工具 Voice Design 开创了 AI 配音领域的新纪元。用户只需通过简单的文本描述,如 「温暖友好的中年女性声音,带着轻微英国口音」,系统便能快速生成符合要求的个性化语音。Voice Design 支持调节多个语音参数,包括年龄、性别、口音、语调和音高等,确保生成的声音精确匹配用户需求。不仅如此,它还突破性地支持创作角色化语音,无论是精灵的空灵之音,还是机器人的金属音效,都能准确捕捉并还原这些虚拟角色的声音特征。用户可以反复调整参数,探索无限的创作可能,为游戏开发、有声内容制作等领域提供了强大的创意工具。

(二)数据分析的新利器

Claude AI 上线了一款强大的新工具,可以分析、可视化 CSV 文件中的数据。此工具类似于 ChatGPT 的代码解释器,能够编写和运行 JavaScript 代码,实现处理数据、进行分析并生成实时洞察。用户可以通过简单的输入提示与上传文件,引导 Claude 逐步地清理、探索及分析数据,直至达到用户期望的结果。它能够给出精确且可重复的答案,并支持创建交互式的数据可视化图表。Anthropic 团队指出,这款新工具在多个领域都能发挥重要作用,比如市场营销人员可上传客户互动数据,Claude 将提供改善转化率的建议;销售团队可以上传全球销售数据,Claude 将提供各国的绩效分析;产品经理可通过上传客户参与数据,Claude 帮助指导开发优先级;工程师上传性能日志,Claude 将识别资源利用的改进空间;财务团队可上传月度财务数据,Claude 将创建财务仪表板,展示关键趋势。目前,这一强大的新功能在
Claude.ai
中处于功能预览阶段,用户可以随时启用或禁用该功能。

四、AI 圈的未来展望

10 月 27 日的 AI 圈可谓热闹非凡,各大巨头纷纷发力,技术不断突破,工具持续创新。OpenAI 被曝推出新模型,谷歌积极参与竞赛,Meta 开展新闻合作,这些事件不仅展示了当前 AI 领域的激烈竞争态势,也为未来的发展奠定了基础。
仿生机器人的出现,为医疗、制造等领域带来了新的可能性。动作捕捉工具的革新,极大地简化了动画制作过程,为影视行业带来了新的创作方式。语音定制工具和数据分析新利器的推出,为游戏开发、市场营销等领域提供了强大的创意和分析手段。
这些事件对 AI 发展的影响是深远的。首先,它们推动了 AI 技术的不断进步,促使各大公司加大研发投入,提高模型性能和功能。其次,这些创新将加速 AI 在各个行业的应用,提高生产效率,改善用户体验。最后,它们也引发了人们对 AI 伦理和治理的关注,促使社会各界共同探讨如何确保 AI 的安全、可靠和可持续发展。
展望未来,AI 领域的发展趋势将呈现以下几个特点:

(一)多模态融合

随着技术的不断发展,AI 将实现多模态融合,能够处理文本、声音、图像等多种输入信息,并将其融合起来进行综合理解。这将为文艺作品创作、智能家居、智慧城市等领域带来全新的应用场景。

(二)与人类协同发展

AI 将不再仅仅是一种工具,而是人类的 「左膀右臂」。在医疗、教育、法律等领域,AI 将辅助人类进行决策和工作,提高生产力和生产水平。

(三)伦理和法规的完善

随着 AI 在日常生活中的参与度不断上升,伦理和法规问题将更加受到关注。未来,将制定更加严格的标准,确保 AI 技术的公平、透明和负责任发展。

(四)量子计算与 AI 的结合

量子计算将为 AI 插上翅膀,加速机器学习和优化算法,实现更高效、更准确的 AI 应用。
总之,未来的 AI 领域充满了机遇和挑战。我们期待着 AI 技术的不断进步,为人类带来更多的福祉。