七大模型参加高考后分数出炉：AI参加理科高考只能上二本！

2024-07-21科技

在信息科技的飞速发展下， AI已经渗透到了我们的日常工作当中，并且取代了许多的传统工作，例如使用 AI可以将画面做得非常好，在短短数秒内就能够做出各种样式的画作，甚至有些 AI还可以非常容易地进行书写，只需要将相应的命令进行相应的操作，就可以将一份论文写出来！再加上人工智能写论文和写文案，人工智能可以说是万能的！所以，问题就来了，人工智能的能力如此之强，让人工智能去写一份试卷，会是什么分数？

就在去年六月份，上海 AI研究中心的 OpenCompass，发布了七个 AI大模型的试卷，对比了它们在不同的大模型下的成绩。哪一种型号性能最佳？这要是让 AI去考试，他们这些人，到底能考上哪个学校？

最后，在最后一次的评测当中， AI建模的成绩已经出炉，由上海 AI研究所和商汤技术合作开发的 AI建模软件InternLM-WQX+VL-20B进行了测评，它的综合成绩是：语文112分，数学74分，英语138.5分，物理39分，化学48分，生物学57分，历史82，地理58分，政治67分，综合成绩468.5分，文科成绩531.5分。

至于 OpenAl模式下的GPT-40，则是语文111.5，数学73，英语141.5，物理36，化学46，生物学65，历史88，地理59，政治58分，其中理科467，文科531。在公开的成绩中，阿里通义千问以546分的成绩排在第一位，而上海人工智能研究中心和尚唐合作开发的蒲语文曲行，得分468.5。

如果是这样的话，以目前的分数来看，河南今年的第一名，应该是文科超过第一名，而第二名，则是第二名。而其他的模特，甚至都没有达到第二梯队！通义千问、书生浦语、文曲星、GPT-4o，都超过了一本，这说明他们对数学有很强的领悟和了解！

所以，很多人猜测，这个大型的建模师，学习能力很强，只要给他足够的时间，他会不会成为顶尖的学生？在这一点上，所有的导师都表示，这个大型的数学模型，在理论上还算可以，但在逻辑上，却并不算太好！尤其是在做一道数学题时，很容易就能发现，这道题的思路很死板，没有任何的逻辑可言。