七大模型參加高考後分數出爐：AI參加理科高考只能上二本！

2024-07-21科技

在資訊科技的飛速發展下， AI已經滲透到了我們的日常工作當中，並且取代了許多的傳統工作，例如使用 AI可以將畫面做得非常好，在短短數秒內就能夠做出各種樣式的畫作，甚至有些 AI還可以非常容易地進行書寫，只需要將相應的命令進行相應的操作，就可以將一份論文寫出來！再加上人工智慧寫論文和寫文案，人工智慧可以說是萬能的！所以，問題就來了，人工智慧的能力如此之強，讓人工智慧去寫一份試卷，會是什麽分數？

就在去年六月份，上海 AI研究中心的 OpenCompass，釋出了七個 AI大模型的試卷，對比了它們在不同的大模型下的成績。哪一種型號效能最佳？這要是讓 AI去考試，他們這些人，到底能考上哪個學校？

最後，在最後一次的評測當中， AI建模的成績已經出爐，由上海 AI研究所和商湯技術合作開發的 AI建模軟體InternLM-WQX+VL-20B進行了測評，它的綜合成績是：語文112分，數學74分，英語138.5分，物理39分，化學48分，生物學57分，歷史82，地理58分，政治67分，綜合成績468.5分，文科成績531.5分。

至於 OpenAl模式下的GPT-40，則是語文111.5，數學73，英語141.5，物理36，化學46，生物學65，歷史88，地理59，政治58分，其中理科467，文科531。在公開的成績中，阿裏通義千問以546分的成績排在第一位，而上海人工智慧研究中心和尚唐合作開發的蒲語文曲行，得分468.5。

如果是這樣的話，以目前的分數來看，河南今年的第一名，應該是文科超過第一名，而第二名，則是第二名。而其他的模特，甚至都沒有達到第二梯隊！通義千問、書生浦語、文曲星、GPT-4o，都超過了一本，這說明他們對數學有很強的領悟和了解！

所以，很多人猜測，這個大型的建模師，學習能力很強，只要給他足夠的時間，他會不會成為頂尖的學生？在這一點上，所有的導師都表示，這個大型的數學模型，在理論上還算可以，但在邏輯上，卻並不算太好！尤其是在做一道數學題時，很容易就能發現，這道題的思路很死板，沒有任何的邏輯可言。