輝達和 Mistral AI 聯手釋出小模型 Mistral Nemo

2024-07-23科技

開發者朋友們大家好：

這裏是「RTE 開發者日報」，每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE（Real-Time Engagement）領域內「有話題的新聞」、「有態度的觀點」、「有意思的數據」、「有思考的文章」、「有看點的會議」，但內容僅代表編輯的個人觀點，歡迎大家留言、跟帖、討論。

本期編輯：@JLT，@卜

01有話題的新聞

1、輝達 Mistral AI 聯手釋出 12B 參數小模型 Mistral Nemo，碾壓 Llama 3 單張 4090 可跑

輝達與 Mistral AI 合作釋出了新的 AI 小模型 Mistral NeMo，具有 120 億參數，支持 128K 上下文，在多項基準測試中擊敗了同類模型 Gemma 2 9B 和 Llama 3 8B。Mistral NeMo 旨在服務於企業使用者，可以輕松客製和部署支持聊天機器人、多語言任務、編碼和摘要的企業應用程式。

Mistral NeMo 模型效能優異，相容性強，易於使用，並且可以直接替代任何使用 Mistral 7B 的系統。模型使用 FP8 數據格式進行推理，減少了記憶體大小並加快了部署速度，同時保持了準確性。Mistral NeMo 還支持多語言套用，具有高效的分詞器 Tekken，提升了對多種語言的處理效率。此外，Mistral NeMo 已經準備好在雲、數據中心或 RTX 工作站等任何地方執行，開發者可以使用 mistral-inference 試用 Mistral NeMo。

2、微軟技術故障造成全球損失或超 10 億美元

7 月 22 日，據美國研究機構安德森經濟集團行政總裁柏德烈·安德森估計，此次微軟技術故障事件造成的經濟損失很可能超過 10 億美元。不過報道稱，Crowdstrike 公司是否會為相關損失買單尚不好說。

Crowdstrike 公司雖已道歉，但沒有回應美國媒體就是否會給予受影響客戶賠償的問詢。有分析人士指出，Crowdstrike 公司與客戶簽訂的合約中或許有免責條款，可使其躲過賠償。（@央視新聞）

3、傳輝達將推出中國特供版「Blackwell」架構 B20 加速器

7 月 22 日，據路透社援引知情人士的訊息報道稱，輝達正在開發面向中國市場的基於全新 Blackwell GPU 架構的 AI 芯片版本，型號暫定為「B20」，該版本將符合美國之前的出口管制政策。

根據美國 2022 年 10 月推出的出口管制的政策，輝達對華出口的 GPU 的 TPP（總處理能力）需要低於 4800 分。最初的 A100/p00 就是超出了這個限制，因此也導致了輝達被迫推出了經過「閹割」的 A800/H800。

今年 3 月，輝達釋出了其新一代的基於「Blackwell」架構的 B200 系列芯片，其晶體管數量達到了 2080 億個，是 p00/p00 的 800 億個晶體管兩倍多，其 20 petaflops 效能達到了 p00（4 petaflops）的 5 倍。據了解，B200 將於今年晚些時候量產。

同樣，輝達也計劃針對中國市場推出基於 B200 的「閹割版本」——B20，但是鑒於美國出口管制政策的限制，輝達 B20 效能相對於 B200 也將會大幅削減，相對於 p0 來說，其效能可能也不會帶來多大的提升，不過其 HBM 的容量有望進一步提升，這對於 AI 訓練和推理來說有著很大的助力。預計也將於今年晚些時候投入生產。（@搜狐科技）

4、Flow Studio：將單一文本轉換成高質素的短片

Flow Studio 是由 Flow GPT 團隊開發的能將文本轉換成高質素的短片的工具。該平台由 Lifan Wang、Sam Xu、Qianhua Ge、Jay Dang 和 Luke Pioneero 共同開發，於 2024 年 7 月 18 日在 Product Hunt 上釋出。Flow Studio 的亮點是能夠透過單一的文本提示，自動生成一個包含故事、配音、背景音樂和聲效的完整影片，極大地簡化了影片制作過程。Flow GPT 獲得了使用者的高度評價，平均得分為 4.9/5 星。

創始人 Jay Dang 大學在加州大學柏克萊分校學習電腦科學，他是 FlowGPT、Markit AI 和 LUUM 的創始人，也在 C。Light Technologies, Inc. 和 Glaucomark 擔任過數據科學家和獨立研究員。（@AI 科技評論）

5、GitHub Trending 熱榜，構建多智能體和 RAG 的框架 Langflow

Langflow 是一個視覺化的框架，旨在幫助開發者構建多智能體和 RAG 應用程式。專案基於 Python 開發，已開源，可以完全自訂，同時支持不同的語言模型和向量儲存。使用者可以透過 pip 安裝 Langflow，並且需要確保系統中安裝的 Python 版本至少為 3.10。專案提供了詳細的文件和部署指南。（@AI 科技評論）

6、馬斯克：特斯拉有望 2026 年大規模生產人形機器人，供其他公司使用

7 月 22 日，馬斯克在 X（推特）上發文透露，特斯拉明年將生產出「真正有用」的機器人供公司內部使用，但僅僅是小規模生產。2026 年，特斯拉有望大規模生產人形機器人，供其他公司使用。

今年 7 月 4 日的 2024 世界人工智能大會期間，特斯拉二代人形機器人 Optimus 亮相。近期，二代 Optimus 已經在特斯拉工廠嘗試「打工」。借助視覺神經網絡和 FSD 芯片，二代 Optimus 可以模仿人類操作，進行電池的分揀訓練。

馬斯克在上月召開的股東大會上宣布，把特斯拉的未來押註在 Optimus 機器人計劃上，當前擬人機器人市場年產 10 億台，特斯拉未來至少要占據 10% 的份額。馬斯克當時表示，特斯拉以每台約 1 萬美元的價格批次制造機器人，並以 2 萬美元（當前約 14.6 萬元人民幣）的價格出售，從而獲得 1 萬億美元的利潤。此外，馬斯克相信到 2026 年，Optimus 將成為一個完全軟件客製的機器人。（@IT 之家）

02有態度的觀點

1、大模型時代結束？大佬齊預測：AI 模型或需先縮小規模，才能再擴大規模

AI 領域出現新趨勢，小模型因成本效益和易於部署受到關註。前 OpenAI 研究員 Andrej Karpathy 預測，未來 AI 模型將更小但更智能。大模型雖具數據吞吐和泛化能力，但面臨高成本和資源消耗問題。小模型可從大模型中提煉最佳化，實作高效能。高質素數據整合為 AI 訓練關鍵，小模型可能引領 AI 發展新方向。（@新智元）

寫在最後：

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創，感興趣的朋友請透過開發者社區或公眾號留言聯系，記得報暗號「共創」。

對於任何反饋（包括但不限於內容上、形式上）我們不勝感激、並有小驚喜回饋，例如你希望從日報中看到哪些內容；自己推薦的信源、專案、話題、活動等；或者列舉幾個你喜歡看、平時常看的內容渠道；內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網絡新聞