当前位置: 华文世界 > 科技

七大模型参加高考后分数出炉:AI参加理科高考只能上二本!

2024-07-21科技

在信息科技的飞速发展下, AI已经渗透到了我们的日常工作当中,并且取代了许多的传统工作,例如使用 AI可以将画面做得非常好,在短短数秒内就能够做出各种样式的画作,甚至有些 AI还可以非常容易地进行书写,只需要将相应的命令进行相应的操作,就可以将一份论文写出来!再加上人工智能写论文和写文案,人工智能可以说是万能的!所以,问题就来了,人工智能的能力如此之强,让人工智能去写一份试卷,会是什么分数?

就在去年六月份,上海 AI研究中心的 OpenCompass,发布了七个 AI大模型的试卷,对比了它们在不同的大模型下的成绩。哪一种型号性能最佳?这要是让 AI去考试,他们这些人,到底能考上哪个学校?

最后,在最后一次的评测当中, AI建模的成绩已经出炉,由上海 AI研究所和商汤技术合作开发的 AI建模软件InternLM-WQX+VL-20B进行了测评,它的综合成绩是:语文112分,数学74分,英语138.5分,物理39分,化学48分,生物学57分,历史82,地理58分,政治67分,综合成绩468.5分,文科成绩531.5分。

至于 OpenAl模式下的GPT-40,则是语文111.5,数学73,英语141.5,物理36,化学46,生物学65,历史88,地理59,政治58分,其中理科467,文科531。在公开的成绩中,阿里通义千问以546分的成绩排在第一位,而上海人工智能研究中心和尚唐合作开发的蒲语文曲行,得分468.5。

如果是这样的话,以目前的分数来看,河南今年的第一名,应该是文科超过第一名,而第二名,则是第二名。而其他的模特,甚至都没有达到第二梯队!通义千问、书生浦语、文曲星、GPT-4o,都超过了一本,这说明他们对数学有很强的领悟和了解!

所以,很多人猜测,这个大型的建模师,学习能力很强,只要给他足够的时间,他会不会成为顶尖的学生?在这一点上,所有的导师都表示,这个大型的数学模型,在理论上还算可以,但在逻辑上,却并不算太好!尤其是在做一道数学题时,很容易就能发现,这道题的思路很死板,没有任何的逻辑可言。