當前位置: 華文世界 > 科技

輝達聯合釋出 Mistral-NeMo AI 模型:120 億參數

2024-07-19科技

IT之家 7 月 19 日訊息,輝達聯合法國初創公司 Mistral AI,今天釋出了全新的 Mistral-NeMo AI 大語言模型,擁有 120 億個參數, 上下文視窗(AI 模型一次能夠處理的最大 Token 數量)為 12.8 萬個 token。

VentureBeat 與 Midjourney 合作制作

Mistral-NeMo AI 大模型主要面向企業環境,讓企業不需要使用大量雲資源的情況下,實施人工智慧解決方案。

由於 Mistral NeMo 依賴於標準架構,因此企業在使用過程中可直接替換任何使用 Mistral 7B 的系統。

輝達是 GPU 制造和人工智慧硬體領域的巨頭,而 Mistral AI 則是歐洲人工智慧領域的後起之秀,雙方的合作標誌著人工智慧行業的企業解決方案發生了重大轉變。

行業分析師認為,這一版本可能會極大地顛覆人工智慧軟體市場。Mistral-NeMo 的推出代表著企業人工智慧部署的潛在轉變。

透過提供一種可在本地硬體上高效執行的模式,輝達和 Mistral AI 正在解決阻礙許多企業廣泛采用人工智慧的問題,如數據私密、延遲以及與基於雲的解決方案相關的高成本。

此舉有可能創造公平的競爭環境,讓資源有限的小型企業也能利用人工智慧功能,而這些功能以前只有擁有大量 IT 預算的大型企業才能使用。

然而,這一發展的真正影響將取決於該模型在實際套用中的表現,以及圍繞該模型開發的工具和支持生態系。

該模型以 Apache 2.0 授權釋出,允許商業使用,這將加速其在企業環境中的套用。IT之家附上官方公布的該 AI 模型效能參數如下:

表 1:Mistral NeMo 基本模型與 Gemma 2 9B 和 Llama 3 8B 的效能比較。
圖 1:Mistral NeMo 在多語言基準測試中的表現。
圖 2:Tekken 壓縮率
Mistral NeMo 指令調整模型精度。使用 GPT4o 根據官方參考文獻進行的評估。

參考