當前位置：華文世界 > 科技

全球3.5億下載量破紀錄！Llama家族暴漲10倍，開源帝國掀AI革命

2024-08-31科技

編輯：桃子好困

【新智元導讀】誕生一年半， Llama 家族早已穩坐開源界頭把交椅。最新報告稱，Llama全球下載量近3.5億，是去年同期的10倍。而模型開源讓每個人最深體會是，token價格一降再降。

Llama一舉成為世界開源的領頭羊。

截至目前，Llama模型在開源平台HuggingFace下載量近3.5億。

Groq的創始人表示，這也太瘋狂了，想想Linux花了多長時間才達到這個數位？

官博介紹，這一數位，是去年同期的10倍。而且，僅在上個月，模型的下載量超2000萬次。

2023年2月，Llama 1首次亮相，經過多次叠代，到現在已經過去了整整18個月。

而在這僅有的一年半裏，Llama已經從一個最先進的單體基礎模型，發展成為，一個面向開發者的強大生態系。

LeCun還不忘給自家模型宣傳一波，越來越多的大公司、小公司、初創公司、政府和非營利組織，正基於此開發新的產品和服務。

還有高校機構、研究人員和工程師每天都在改進Llama，並提出新的用例。

另外，值得關註的一點是，自今年5月Llama 3.1釋出之後，雲服務商對模型API token呼叫需求，翻了一番還要多。

一些Meta最大的雲服務提供商，從2024年1月到7月，Llama的每月token量增長了10倍。

從微軟雲、輝達、谷歌雲等科技巨頭，到Groq、 Databricks 等初創公司，全都支持Llama模型的使用。

老黃稱，「Llama深深地影響著最先進AI的進步」。

可見，Llama正引領著開源之光。

Llama開源，拉低token價格戰

GPT-4級別模型開源，最先帶來的好處是，token的價格不斷下降。

AI大牛吳恩達在DeepLearning的部落格中，算了一筆賬：

近期，OpenAI官宣降價後，GPT-4o的 token成本，現在是每百萬token4美元。（假設是80%輸入和20%輸入token混合率）

還記得，2023年3月先發GPT-4時，每百萬token的成本是36美元。

部落格地址：https://www.deeplearning.ai/the-batch/issue-264/

17個月的時間，價格相當於每年下降了79%（4/36 = (1 - p)^{17/12}）。

如你所見，token價格正迅速下降！

而推動token價格不斷下降的一個因素，便是開源模型（如Llama 3.1）的釋出。

這是因為，API提供商（如Anyscale、Fireworks、Together AI初創公司，以及一些大型雲服務商）並不需要擔心賺回開發模型所需的成本，因此他們可以直接在價格、速度等其他因素上，開啟競爭。

此外，一些芯片公司Groq（快速生成token領先者）、Samba Nova（能以114 token/s速度執行Llama 3.1 405B）、 Cerebras（以1800 token/s速率執行Llama 3.1 8B），以及輝達、AMD、英特爾、高通等半導體巨頭，在硬體上的創新，近一步拉低了模型價格。

Groq發文介紹了，如今支持Llama模型的生態。

「到目前為止，Groq已經使用Llama模型套件和自家LPU Inference，每天向40多萬開發人員提供50億個免費token」。

在構建用程式時，吳恩達發現，根據未來技術發展方向，進行設計是非常有用的，而非局限於當前水平。

基於多家軟硬體公司的技術路線（改進半導體、更小的模型、推理架構中的演算法創新），可以預見的是，token價格還將持續下降。

這意味著，即便你構建的智慧體工作流看起來成本太高，而隨著token價格不斷下降，或許在某個時間，這套方案在未來也變得經濟可行。

假設你建立了一個APP幫助人類，可每秒連續輸出100個token。那如果百萬token 4美元，每小時只花費1.44美元。

這遠遠低於美國，以及許多其他國家最低薪資標準。

Meta挑戰ChatGPT贏得數百萬使用者

小紮希望，到今年年底，讓Meta AI成為全球使用量最多的AI助手，超越OpenAI的ChatGPT。

目前，這一切正朝著他的目標，取得了進展。

據內部2位員工透露，8月初，Meta AI（2023年9月釋出）在釋出不到一年時間裏，收攬了至少4億月活躍使用者和4000萬日活躍使用者。

這些數位從側面反映了，超30億使用者的Meta，每天至少使用Meta旗下的一款套用中的AI助手。

此外還包括，透過Meta AI專屬網站，以及Ray-Ban智慧眼鏡，也收獲了不少使用者。

龐大的使用者群，成為大型科技公司優勢，希望從ChatGPT中奪取一部份市場份額和關註度。

其實，谷歌也向數十億使用者推廣了對話式AI——Gemini，但力度卻不如Meta。

但一些使用Meta應用程式的人，在Facebook、Reddit、X上，抱怨Meta過於激進地推廣AI助手，比如在其APP的鍵盤上添加搜尋按鈕。

有的人還出了一個關閉Meta AI對話的教程。

出於對使用者參與度的擔憂，Meta員工可能會非週期性討論的一個問題是，是否有些使用者無意間使用了Meta AI。

8月初使用數據顯示，大約10%的月活躍使用者，每天使用助手來回答問題、生成影像和執行其他任務。

而這一比例遠低於Meta的其他應用程式。

Meta此前2月報告稱，80%的月活躍使用者每天至少使用一款自家的套用。

這些數位表明，Meta AI已經是ChatGPT強有力的競爭者之一。

2022年11月，ChatGPT首次推出。截至目前，每周有超2億人使用。鑒於最近的使用數據，Meta AI可能相距不遠。

與Meta AI不同，ChatGPT也是一項盈利的業務模型。

數百萬使用者每月需要支付20美元，成為ChatGPT Plus使用者，才能用上最先進模型撰寫、編程、答問的能力。

數據顯示，ChatGPT訂閱收入，每年大約高達20億美元。

Meta已在今年投入高達400億美金數據中心和其他基礎設施。

而Meta AI被視為，未來公司獲得這些巨額投資報酬的關鍵部份，主要用於開發這一產品的背後大模型Llama。

雖有報道曝出，Meta正推出一個付費版的高級人工智慧助手。

去年9月，Meta剛剛推出AI助手時，人們最初只能透過Instagram、WhatsApp或Messenger上的直接訊息與Meta AI聊天。

今年，Meta開始在各種套用中，讓其變得更加顯眼、容易存取。

4月，他們將Meta AI添加到其應用程式的搜尋欄和資訊流中，並為其推出了獨立網站meta.ai。

同月，Meta還推出了一個新版本的AI助手，該版本能夠辨識和解析影像，並在其Ray-Ban智慧眼鏡中廣泛套用。

目前，該助手在Meta的應用程式中可用的語言有8種，並在22個國家提供，同時在美國和加拿大的智慧眼鏡中提供英語版本。

開源AI如火如荼

開源AI技術正在迅速發展，推動著生成式AI的重大創新。透過GitHub和Hugging Face等可存取的研究和平台，社群已經啟動了取得突破性成果的計畫。

生態系：穩步增長，走出泡沫化的底谷期（Trough of Disillusionment）

自2023年第一季度的溫和增長以來，開發者的興趣已經增長並穩定下來，進入了「穩步爬升的光明期」（Slope of Enlightenment）——價值驅動的創新在此增長。

2024年，開源AI中嚴肅的開發者參與（即GitHub貢獻者）仍在繼續增加。

市場分析：開發工具仍是熱門，訓練和監督勢頭正旺

- 開源AI產品初創企業數量顯著增加

2024年，參與開源AI的參與者數量激增，新的參與者如Neum AI和Patronus AI進入了這一領域，而像Vian AI這樣的老牌參與者也為其使用者提供了開源工具包。

- 開發工具仍然熱門；培訓和監控工具競爭加劇

大多數初創企業仍專註於生成式AI的開發工具，這對於構建、部署和管理應用程式至關重要。

然而，圍繞模型訓練和監督用例的初創企業活動有所增加，這表明可能會向在小眾數據上微調模型和增強AI治理的方向轉變。

在開源模型領域，領先者開始顯現，開發的新模型較少，更多的重點放在來自Mistral和Meta等公司的改進和更高效的版本上。

- 開源開發正在縮小與閉源解決方案的差距

開源使得研究更具成本效益和可存取性，促進了來自多元創作者的創新，並且法律限制較少。據統計，有41%的企業使用者傾向於選擇開源來滿足生成式AI的需求。

融資環境：融資步伐加快，規模更大、後期交易增多

過去兩年，開源AI領域已完成60多筆交易，總融資額超過130億美元。這些交易中有超過45%屬於A輪及以上的融資，表明對增長階段投資的強烈關註。

- Deci AI被輝達以3億美元收購

- Scale AI完成了10億美元的F輪融資

- Mistral AI完成了6.4億美元的B輪融資

- Together AI完成了1.06億美元的A輪融資

在開源AI領域中，模型訓練和開發工具是獲得資金最多的細分領域（不包括Mistral和Databricks），占總融資的60%。

其中，輝達參與了8筆交易（包括Scale AI、Mistral AI、Together AI）。

基礎模型：效能差距已縮小

如今，開源和閉源模型之間的基準差距現在比以往任何時候都要小——Meta Llama和Mistral在MMLU上的表現幾乎與GPT-4o相同。

其他開源模型，如Qwen和Yi，也在效能上快速趕上。

為了解決現有評估（如Elo和MMLU）的局限性，Hugging Face於2024年6月正式推出了專註於復雜任務的開源LLM排行榜——Open-LLM-Leaderboard。

在過去的6個月中，隨著新競爭者的出現，開源AI的格局發生了顯著變化。

經過大量數據預訓練的Qwen，於2024年6月在Huggingface Traction上獲得了最高的下載量。

Github：Huggingface、MindsDB和Roboflow非常火爆

GitHub的stars是計畫在GitHub上受歡迎程度的直接指標。

AutoGPT 和ModularML的Mojo在2023年引領了GitHub熱度——自那時以來，多個倉庫已經獲得了顯著的進展。

LeRobot提供基於PyTorch的真實世界機器人模型、數據集和工具，旨在使機器人技術更易於存取。它具有最先進的模仿學習和強化學習方法，提供預訓練模型、人類收集的數據集和模擬環境。

由輝達支持的MindsDB是一個使用企業數據構建AI模型的平台。MindsDB簡化了資料來源和AI/ML工具之間的連線，自動化工作流程以建立客製的AI系統。

參考資料：

https://ai.meta.com/blog/llama-usage-doubled-may-through-july-2024/?utm_source=twitter&utm_medium=organic_social&utm_content=image&utm_campaign=llama

https://x.com/ylecun/status/1829233754876834298

https://www.theinformation.com/articles/metas-ai-assistant-wins-millions-of-users-in-challenge-to-chatgpt?rc=epv9gi

https://synaptic.com/resources/open-source-ai-2024/

Copyright © 2024 www.aqiusha.com NO.1 華文世界

商務合作：xingwa#jasve.com（傳送郵件請將#換成@）