10 月 22 日,Anthropic 正式发布了升级版 Claude 3.5 Sonnet 和新型号 Claude 3.5 Haiku。这两款新模型在性能和功能上都有显著提升,特别是 Claude 3.5 Sonnet,首次引入了「计算机使用」功能,能够模拟人类在电脑上的操作。
Claude 3.5 Sonnet 在编程能力上表现出色,处理输入的速度是前代模型的两倍,在编码挑战中修复了 64%的代码错误。更重要的是,Claude 3.5 Sonnet 引入了「计算机使用」功能,能够通过 API 模拟人类的计算机操作。这一功能允许 AI 模型在屏幕上移动光标、点击按钮和键入文本,模拟人类与电脑的交互方式。
Anthropic 的首席科学官 Jared Kaplan 表示:「我们将进入一个新时代,模型可以像人一样使用所有的工具来完成任务。」
目前,Claude 3.5 Sonnet 的「计算机使用」功能已开放公开测试。开发者可以通过 API 在 Amazon Bedrock 和 Google Cloud 的 Vertex AI 平台上试用这一功能。这一功能的实现是通过训练 Claude 识别屏幕上的内容,并使用软件工具执行任务。当开发者给 Claude 分配任务并给予必要的访问权限时,Claude 会查看用户可见的屏幕截图,然后计算需要移动光标的像素数以在正确的位置点击。
与此同时,Anthropic 还推出了新型号 Claude 3.5 Haiku。该模型结合了快速响应时间和改进的推理能力,适用于需要速度和智能的任务,如快速准确的代码建议和高度互动的聊天机器人。Claude 3.5 Haiku 的性能与之前的 Claude 3 Opus 相当,但在成本和速度上更具优势。
尽管这些新功能令人兴奋,但 AI 操控计算机也带来了安全风险。Anthropic 表示,通过逐步开放这种有限、相对更安全的 AI 模型,可以帮助提升 AI 代理的安全性。他们强调,现有的安全措施足以应对当前的风险,但未来更强大的模型可能需要更高标准的安全保障。