當前位置: 華文世界 > 科技

輝達和 Mistral AI 聯手釋出小模型 Mistral Nemo

2024-07-23科技

開發者朋友們大家好:

這裏是「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 數據 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@JLT,@卜

01有話題的新聞

1、輝達 Mistral AI 聯手釋出 12B 參數小模型 Mistral Nemo,碾壓 Llama 3 單張 4090 可跑

輝達與 Mistral AI 合作釋出了新的 AI 小模型 Mistral NeMo,具有 120 億參數,支持 128K 上下文,在多項基準測試中擊敗了同類模型 Gemma 2 9B 和 Llama 3 8B。Mistral NeMo 旨在服務於企業使用者,可以輕松客製和部署支持聊天機器人、多語言任務、編碼和摘要的企業應用程式。

Mistral NeMo 模型效能優異,相容性強,易於使用,並且可以直接替代任何使用 Mistral 7B 的系統。模型使用 FP8 數據格式進行推理,減少了記憶體大小並加快了部署速度,同時保持了準確性。Mistral NeMo 還支持多語言套用,具有高效的分詞器 Tekken,提升了對多種語言的處理效率。此外,Mistral NeMo 已經準備好在雲、數據中心或 RTX 工作站等任何地方執行,開發者可以使用 mistral-inference 試用 Mistral NeMo。

2、微軟技術故障造成全球損失或超 10 億美元

7 月 22 日,據美國研究機構安德森經濟集團行政總裁柏德烈·安德森估計,此次微軟技術故障事件造成的經濟損失很可能超過 10 億美元。不過報道稱,Crowdstrike 公司是否會為相關損失買單尚不好說。

Crowdstrike 公司雖已道歉,但沒有回應美國媒體就是否會給予受影響客戶賠償的問詢。有分析人士指出,Crowdstrike 公司與客戶簽訂的合約中或許有免責條款,可使其躲過賠償。(@央視新聞)

3、傳輝達將推出中國特供版「Blackwell」架構 B20 加速器

7 月 22 日,據路透社援引知情人士的訊息報道稱,輝達正在開發面向中國市場的基於全新 Blackwell GPU 架構的 AI 芯片版本,型號暫定為「B20」,該版本將符合美國之前的出口管制政策。

根據美國 2022 年 10 月推出的出口管制的政策,輝達對華出口的 GPU 的 TPP(總處理能力)需要低於 4800 分。最初的 A100/p00 就是超出了這個限制,因此也導致了輝達被迫推出了經過「閹割」的 A800/H800。

今年 3 月,輝達釋出了其新一代的基於「Bl­a­c­k­w­ell」架構的 B200 系列芯片,其晶體管數量達到了 2080 億個,是 p00/p00 的 800 億個晶體管兩倍多,其 20 petaflops 效能達到了 p00(4 petaflops)的 5 倍。據了解,B200 將於今年晚些時候量產。

同樣,輝達也計劃針對中國市場推出基於 B200 的「閹割版本」——B20,但是鑒於美國出口管制政策的限制,輝達 B20 效能相對於 B200 也將會大幅削減,相對於 p0 來說,其效能可能也不會帶來多大的提升,不過其 HBM 的容量有望進一步提升,這對於 AI 訓練和推理來說有著很大的助力。預計也將於今年晚些時候投入生產。(@搜狐科技)

4、Flow Studio:將單一文本轉換成高質素的短片

Flow Studio 是由 Flow GPT 團隊開發的能將文本轉換成高質素的短片的工具。該平台由 Lifan Wang、Sam Xu、Qianhua Ge、Jay Dang 和 Luke Pioneero 共同開發,於 2024 年 7 月 18 日在 Product Hunt 上釋出。Flow Studio 的亮點是能夠透過單一的文本提示,自動生成一個包含故事、配音、背景音樂和聲效的完整影片,極大地簡化了影片制作過程。Flow GPT 獲得了使用者的高度評價,平均得分為 4.9/5 星。

創始人 Jay Dang 大學在加州大學柏克萊分校學習電腦科學,他是 FlowGPT、Markit AI 和 LUUM 的創始人,也在 C。Light Technologies, Inc. 和 Glaucomark 擔任過數據科學家和獨立研究員。(@AI 科技評論)

5、GitHub Trending 熱榜,構建多智能體和 RAG 的框架 Langflow

Langflow 是一個視覺化的框架,旨在幫助開發者構建多智能體和 RAG 應用程式。專案基於 Python 開發,已開源,可以完全自訂,同時支持不同的語言模型和向量儲存。使用者可以透過 pip 安裝 Langflow,並且需要確保系統中安裝的 Python 版本至少為 3.10。專案提供了詳細的文件和部署指南。(@AI 科技評論)

6、馬斯克:特斯拉有望 2026 年大規模生產人形機器人,供其他公司使用

7 月 22 日,馬斯克在 X(推特)上發文透露,特斯拉明年將生產出「真正有用」的機器人供公司內部使用,但僅僅是小規模生產。2026 年,特斯拉有望大規模生產人形機器人,供其他公司使用。

今年 7 月 4 日的 2024 世界人工智能大會期間,特斯拉二代人形機器人 Optimus 亮相。近期,二代 Optimus 已經在特斯拉工廠嘗試「打工」。借助視覺神經網絡和 FSD 芯片,二代 Optimus 可以模仿人類操作,進行電池的分揀訓練。

馬斯克在上月召開的股東大會上宣布,把特斯拉的未來押註在 Optimus 機器人計劃上,當前擬人機器人市場年產 10 億台,特斯拉未來至少要占據 10% 的份額。馬斯克當時表示,特斯拉以每台約 1 萬美元的價格批次制造機器人,並以 2 萬美元(當前約 14.6 萬元人民幣)的價格出售,從而獲得 1 萬億美元的利潤。此外,馬斯克相信到 2026 年,Optimus 將成為一個完全軟件客製的機器人。(@IT 之家)

02有態度的觀點

1、大模型時代結束?大佬齊預測:AI 模型或需先縮小規模,才能再擴大規模

AI 領域出現新趨勢,小模型因成本效益和易於部署受到關註。前 OpenAI 研究員 Andrej Karpathy 預測,未來 AI 模型將更小但更智能。大模型雖具數據吞吐和泛化能力,但面臨高成本和資源消耗問題。小模型可從大模型中提煉最佳化,實作高效能。高質素數據整合為 AI 訓練關鍵,小模型可能引領 AI 發展新方向。(@新智元)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社區或公眾號留言聯系,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網絡新聞