当前位置: 华文世界 > 科技

OpenAI推出GPT-4o,这些能力获得大幅升级,对所有用户免费开放!

2024-05-14科技
  • OpenAI 推出了 GPT-4o,这是一个改进版本,具有更快的响应时间和新的语音技术。

  • GPT-4o 提供实时文本转语音响应,并能够调整情绪化的语调。

  • 与以前的型号不同,GPT-4o 免费提供给所有用户,付费用户可以获得卓越的容量。

  • OpenAI 周一宣布了其最新的人工智能大型语言模型 GPT-4 的迭代 GPT-4o,据称这将使 ChatGPT 更智能、更易于使用。

    GPT-4o

    据了解,更新后的模型「速度更快」,并提高了「文本、视觉和音频的能力」,OpenAI 首席技术官 Mira Murati 在周一的直播公告中表示。穆拉蒂补充说,它将对所有用户免费,付费用户将继续「拥有高达免费用户五倍的容量限制」。

    OpenAI 在该公司的一篇博客文章中表示,GPT-4o 的功能「将迭代推出」,但其文本和图像功能将于今天开始在 ChatGPT 中推出。

    OpenAI 首席执行官 Sam Altman 表示,该模型是「原生多模态的」,这意味着该模型可以生成内容或理解语音、文本或图像中的命令。Altman 在 X 上补充说,想要修补 GPT-4o 的开发人员将可以访问 API,它的价格是 GPT-4 Turbo 的一半,速度是 GPT-4 Turbo 的两倍。

    作为新模型的一部分,ChatGPT 的语音模式即将推出新功能。OpenAI 表示,GPT-4o 的工作方式与 GPT-4 类似,但工作速度比前代快得多。GPT-4o 还在其语音模式背后添加了新技术,人们使用麦克风与 ChatGPT 交谈。OpenAI 希望使用语音模式与 ChatGPT 交谈,就像与真人交谈一样,但演讲者完成和 ChatGPT 回复之间的延迟破坏了沉浸感。现在,该公司正在 GPT-4o 背后添加新技术,使与聊天机器人交谈感觉尽可能自然。

    他们还展示了检测用户情绪的模型;在一个例子中,它倾听了一位高管的呼吸,并鼓励他冷静下来。

    根据该公司周一的演示,GPT-4o 将有效地将 ChatGPT 变成一个数字个人助理,可以进行实时的口语对话。它能够使用文本和「视觉」进行交互,这意味着它可以查看用户上传的屏幕截图、照片、文档或图表,并就它们进行对话。

    比如,演示者写出了一个方程式,并通过手机摄像头将其展示给 GPT-4o。主持人要求 GPT-4o 帮助他们解决这个问题,但不要透露答案。果不其然,GPT-4o 指导演示者完成解决简单方程的过程,就像一个好的数学老师一样。此外,它甚至还回答了典型的「我什么时候会在现实生活中使用它?」的问题,解释了二次方程如何帮助我们完成日常任务。

    演示者还使用桌面版的 GPT-4o 来检查他们拥有的一些代码。GPT-4o 不仅可以解释代码的作用,还可以告诉如果你调整它的特定部分会发生什么。示威者表明,GPT-4o 可以充当现场翻译,听两个人说不同的语言,并告诉一个人用他们的母语说了什么。

    OpenAI 首席技术官 Mira Murati 表示,ChatGPT 的更新版本现在还将具有记忆功能,这意味着它可以从之前与用户的对话中学习,并可以进行实时翻译。

    「这是我们第一次在易用性方面真正向前迈出了一大步,」Murati在公司旧金山总部的现场演示中说。「这种互动变得更加自然,也变得更加容易。

    Murati 表示,OpenAI 将在未来数月内为Windows和Mac平台推出具有 GPT-4o 功能的 ChatGPT 桌面应用程序。GPT-4o 也将提供给希望从 OpenAI 的 GPT 商店构建自己的自定义聊天机器人的开发人员,该功能现在也可供非付费用户使用。他表示,免费 ChatGPT 用户与新 GPT-4o 模型的交互次数有限,交互次数用尽后,然后该工具会自动恢复基于旧 GPT-3.5 模型的问答。

    新版本发布之际,OpenAI 寻求在 AI 军备竞赛中日益激烈的竞争中保持领先地 位。包括谷歌和 Meta 在内的竞争对手一直在努力构建越来越强大的大型语言模型,这些模型为聊天机器人提供动力,并可用于将 AI 技术引入其他各种产品。

    #热点引擎计划#OpenAI 表示,已经有超过 1 亿人在使用 ChatGPT。但是,更新的 ChatGPT 体验——以及在桌面上和通过改进的语音对话与之交互的能力——可能会让更多人有理由使用OpenAI的服务。

    OpenAI 活动是在谷歌年度 I/O 开发者大会的前一天举行的,预计谷歌将在大会上宣布其 Gemini AI 模型的更新。与新的 GPT-4o 一样,谷歌的 Gemini 也是多模态的,这意味着它可以解释和生成文本、图像和音频。OpenAI 的更新也发生在苹果在下个月的全球开发者大会上宣布 AI 之前,其中可能包括将 AI 整合到下一个 iPhone 或 iOS 版本中的新方法。

    与此同时,最新的 GPT 版本对 Microsoft 来说可能是一个福音,该公司已向 OpenAI 投资数十亿美元,将其 AI 技术嵌入Microsoft自己的产品中。