AI也偏科：语文很厉害，但数学不行！

2024-07-24科技

在过去的一年里，人工智能（AI）领域取得了令人瞩目的进展，尤其是在语言处理和生成方面。像OpenAI的ChatGPT这样的AI聊天机器人展示了强大的语言能力，能够撰写诗歌、总结书籍并回答各种问题。然而，这些智能系统在数学领域表现出的不足也引发了广泛的讨论和关注。尽管AI在许多方面展示了超人的能力，但其在数学方面的表现却不尽如人意，这揭示了当前AI技术的局限性和未来的发展方向。

当前的AI聊天机器人，如ChatGPT，展现了令人惊叹的语言处理能力。它们可以根据海量的训练数据生成连贯且具有深度的文本，模仿人类的交流方式。然而，当涉及到数学问题时，这些系统常常显得力不从心。虽然AI可以根据所学知识进行数学运算，但由于其主要依赖概率而非规则计算，结果往往不准确。

正如西北大学计算机科学教授兼人工智能研究员克里斯蒂安·哈蒙德（Kristian Hammond）所言，AI聊天机器人在数学方面表现不佳，因为它们从未被设计为数学专家。AI的基础技术是通过分析大量数据进行学习，而非通过严格的规则编程。这种方法在语言处理上取得了巨大成功，但在数学上则表现出明显的局限性。

回顾计算机科学的发展历史，传统计算机被编程为遵循严格的规则和结构化数据库，以进行快速、准确的计算。在20世纪40年代早期，计算的主要目标是强化数学能力，计算机成为了不知疲倦的数字处理机器。然而，这种基于规则的编程方式也导致了计算机系统的脆弱性，尤其在处理复杂和多变的任务时。

十多年前，神经网络技术的突破改变了这一局面。神经网络大致模仿人类大脑，通过分析大量数据进行学习，不再依赖严格的规则。这种技术在语言处理上表现出了卓越的能力，但在数学推理和应用题上仍存在不足。AI聊天机器人在面对需要多个步骤才能解决的简单算术问题时，常常出错，表现不稳定

尽管AI在数学方面的表现欠佳，但教育领域仍在积极探索其应用潜力。Khan Academy首席学习官Kristen DiCerbo在一次研讨会上提到，数学准确性是AI在教育中的一个重要问题。Khan Academy正在试验AI聊天机器人作为导师和教学助理，并对其AI系统Khanmigo进行了调整，将许多数学问题发送给计算器程序处理，以提高准确性。

OpenAI也在持续改进其AI系统在数学方面的表现。根据OpenAI的声明，数学是一个「重要的持续研究领域」，其科学家们在这一领域取得了稳步进展。最新版本的GPT在一个包含数千个需要视觉感知和数学推理的问题数据库中实现了近64%的准确率，高于之前版本的58%。这种进步显示出AI在数学领域的潜力，但距离真正的精确计算还有很长的路要走。

AI在数学上的不足引发了关于该领域最佳发展方向的激烈辩论。当前，存在两种主要观点。一方面，有人认为先进的神经网络和大型语言模型是实现通用人工智能（AGI）的唯一途径。AGI是指能够完成任何人类大脑能完成的任务的计算机，这一观点在硅谷得到了广泛支持。

另一方面，怀疑者如Meta首席人工智能科学家Yann LeCun认为，仅仅增加数据和计算能力不足以解决AI的所有问题。他提出了一种更广泛的方法，称之为「世界建模」，即开发能够像人类一样理解世界运作方式的系统。这种方法可能需要十年的时间才能实现，但被认为是更为全面和长远的解决方案。

尽管AI在数学上的表现存在不足，但在实际应用中仍展示了巨大的潜力。例如，Meta正在其社交媒体服务中整合AI助手软件，利用其大型语言模型LLaMA。这些助手虽然在逻辑和常识推理上存在缺陷，但在处理日常任务和提供用户支持方面表现出色。

David Ferrucci领导的团队开发了著名的IBM Watson计算机，该计算机在2011年击败了人类「危险边缘！」选手。Ferrucci博士的初创公司Elemental Cognition正在开发使用大型语言模型和基于规则的软件，以改善金融、旅游和药物研发等领域的决策。这种结合了结构化软件和语言模型的方法展示了AI在商业应用中的前景。

纽约高中数学老师Kirk Schneider认为，AI聊天机器人进入教育领域是不可避免的。他指出，尽管学校可能试图禁止AI的使用，但学生们仍会找到使用它们的方法。Schneider先生认为，AI的偶尔失误反而可以成为教育的机会，帮助学生发展批判性思维。

在课堂上，Schneider先生经常将学生分成小组，让他们比较自己的答案和AI的答案。这种方法不仅培养了学生的数学能力，还教会他们用批判的眼光看待AI生成的信息。这是一种重要的技能，即使在未来AI技术不断进步的情况下，学生们仍需要保持独立思考和判断的能力。

人工智能在语言处理上的卓越表现与其在数学上的不足形成了鲜明对比。这种对比揭示了当前AI技术的局限性，同时也指明了未来的发展方向。随着AI技术的不断进步，我们有理由相信其在数学领域的表现会逐步改善。