IT之家 7 月 23 日訊息,網友在 LocalLLaMA 子 Reddit 板塊中發帖,分享了 4050 億參數的 Meta Llama 3.1 資訊,從該 AI 模型在幾個關鍵 AI 基準測試的結果來看,其效能超越目前的領先者(OpenAI 的 GPT-4o)。
這是開源人工智能社區的一個重要裏程碑,標誌著開源模型可能首次擊敗目前最先進的閉源 LLM 模型。
如基準測試所示,Meta Llama 3.1 在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 和 winograd 等多項測試中均優於 GPT-4o,但是,它在 HumanEval 和 MMLU-social sciences 方面卻落後於 GPT-4o。
值得註意的是,這些數據來自 Llama 3.1 的基本模型,意味著後續透過調整最佳化,可以進一步釋放該模型的潛力,在上述基準測試中邁上更高的台階。