Meta Llama 3.1-405B AI模型多項跑分超越 OpenAI GPT-4o

2024-07-23科技

IT之家 7 月 23 日訊息，網友在 LocalLLaMA 子 Reddit 板塊中發帖，分享了 4050 億參數的 Meta Llama 3.1 資訊，從該 AI 模型在幾個關鍵 AI 基準測試的結果來看，其效能超越目前的領先者（OpenAI 的 GPT-4o）。

這是開源人工智能社區的一個重要裏程碑，標誌著開源模型可能首次擊敗目前最先進的閉源 LLM 模型。

如基準測試所示，Meta Llama 3.1 在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem 和 winograd 等多項測試中均優於 GPT-4o，但是，它在 HumanEval 和 MMLU-social sciences 方面卻落後於 GPT-4o。

值得註意的是，這些數據來自 Llama 3.1 的基本模型，意味著後續透過調整最佳化，可以進一步釋放該模型的潛力，在上述基準測試中邁上更高的台階。

IT之家註：上圖為機翻字幕，存在錯誤