Claude升级3.5性能更高成本更低 评论指表现力压ChatGPT

2024-07-21科技

AI发展一日千里，在科创公司互相竞争下俨如进入了「AI战国时代」。不久前AI创新公司Anthropic才推出创作、数理逻辑、图像处理等能力均有卓越表现的Claude 3，不足半年，Anthropic随即推出了新一代Claude 3.5 Sonnet，该模型除进一步提升速度与性能，更大减八成使用成本，有外国评论试用后更直言Claude 3.5 Sonnet已「击败」ChatGPT，成为最出色的AI模型。

由OpenAI前员工成立的Anthropic公司，早于本年3月推出AI模型Claude 3，当时Claude 3分为三个子模型，分别为Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus，其中又以Opus能力最高、Sonnet仅随其后。怎料，未够半年，Anthropic即宣布推出Claude 3.5 Sonnet，其性能更比前一代最高性能的Claude 3 Opus更高，甚至比主要竞争对手GPT-4有着更出色的表现。

例如，在程序编写能力（HumanEval）测试、研究生级专家推理（GPQA）、多语言小学数学问题（MGSM）、文本推理（reasoning over text）方面， Claude 3.5 Sonnet的表现均较前一代Claude 3 Opus及主要竞争对手GPT-4更好。在图像处理方面，Claude 3.5 Sonnet也是Anthropic至今最强大的AI模型，在大多数视觉基准测试之中，表现平均较Claude 3 Opus高出10%，也几乎在各个与图像相关的测试之中优于其他「生成式AI」模型。此外，Claude 3.5 Sonnet能支持更长文本，输出能达每秒80 Token，输出速度较其他竞争对手如GPT-4、Gemini 1.5 Pro更高。最难得的是，在如此高效的表当下，Claude 3.5 Sonnet的成本只需以往Claude 3的五分之一，成本大减80%，变相等于低成本、高效益，自然就吸引了不少用户的青睐。

有外国专评AI及发掘各类「生成式AI」使用方法的Youtube频道「AI Advantage」，先前就直言Claude 3.5 Sonnet已毫无疑问的「击败」了GPT-4。他更于片中枚举了多个Claude 3.5能轻松完成（而GPT 4.0暂未能做到）的用法，例如，片主通过提词赋予Claude 3.5作为「数据可视化专家」（Data visualization expert）的身份，一键输入，即让AI整理数据并设计出一个可以呈现各个国家病毒传播速度的实时仪表板（dashboard），他也强调用户可随意以提词调整及设计样式，轻松呈现Claude 3.5在大数据时代下「数据可视化」（Data visualization）的强大整理、分析及制图能力。

另外，该片主也分享了现在已可通过Claude 3.5，直接把PDF文件制成网站。例如，片中他向Claude 3.5输入一个与制作动画、使用绿幕相关的PDF文件，并要求Claude 3.5据PDF文件创作出一个以叙事驱动为主轴的网站。不消一刻，Claude 3.5随即成功将PDF文件内有关Midjourney及绿幕的内容转换成一个网站，内容则是以文本重新演绎及逐步介绍制作动画的流程。片主指Claude 3.5的强大在于它并不是简单生成一个网站，而是在于它已能将各类型的PDF文件转换成如文本、图像、动画、网页等不同媒介，尽显Claude 3.5的高速运算能力。

片段中也有提及其他Claude 3.5的使用方法，例如使用模型来制作游戏、设计旅行规划程序、制作互动测试网站等等，其余新用法会留在下篇与大家分享，但要记住一点：以往这些在其他AI模型之中需分阶段处理的工作，Claude 3.5现已能一步到位。而在Claude 3.5面世后，其低廉的使用成本也降低了用户的入门门槛，相信往后也会有更多用户投入Claude模型的怀抱。有需要的企业或个人用户也可订阅AWS Amazon Bedrock服务，同样能享受云计算AI的方便快捷，让AI更快捷地完成繁重工作。

数据源：YouTube

Claude升级3.5性能更高成本更低 评论指表现力压ChatGPT

Claude升级3.5性能更高成本更低评论指表现力压ChatGPT