當前位置: 華文世界 > 科技

七大模型參加高考後分數出爐:AI參加理科高考只能上二本!

2024-07-21科技

在資訊科技的飛速發展下, AI已經滲透到了我們的日常工作當中,並且取代了許多的傳統工作,例如使用 AI可以將畫面做得非常好,在短短數秒內就能夠做出各種樣式的畫作,甚至有些 AI還可以非常容易地進行書寫,只需要將相應的命令進行相應的操作,就可以將一份論文寫出來!再加上人工智慧寫論文和寫文案,人工智慧可以說是萬能的!所以,問題就來了,人工智慧的能力如此之強,讓人工智慧去寫一份試卷,會是什麽分數?

就在去年六月份,上海 AI研究中心的 OpenCompass,釋出了七個 AI大模型的試卷,對比了它們在不同的大模型下的成績。哪一種型號效能最佳?這要是讓 AI去考試,他們這些人,到底能考上哪個學校?

最後,在最後一次的評測當中, AI建模的成績已經出爐,由上海 AI研究所和商湯技術合作開發的 AI建模軟體InternLM-WQX+VL-20B進行了測評,它的綜合成績是:語文112分,數學74分,英語138.5分,物理39分,化學48分,生物學57分,歷史82,地理58分,政治67分,綜合成績468.5分,文科成績531.5分。

至於 OpenAl模式下的GPT-40,則是語文111.5,數學73,英語141.5,物理36,化學46,生物學65,歷史88,地理59,政治58分,其中理科467,文科531。在公開的成績中,阿裏通義千問以546分的成績排在第一位,而上海人工智慧研究中心和尚唐合作開發的蒲語文曲行,得分468.5。

如果是這樣的話,以目前的分數來看,河南今年的第一名,應該是文科超過第一名,而第二名,則是第二名。而其他的模特,甚至都沒有達到第二梯隊!通義千問、書生浦語、文曲星、GPT-4o,都超過了一本,這說明他們對數學有很強的領悟和了解!

所以,很多人猜測,這個大型的建模師,學習能力很強,只要給他足夠的時間,他會不會成為頂尖的學生?在這一點上,所有的導師都表示,這個大型的數學模型,在理論上還算可以,但在邏輯上,卻並不算太好!尤其是在做一道數學題時,很容易就能發現,這道題的思路很死板,沒有任何的邏輯可言。