當前位置: 華文世界 > 科技

全球3.5億下載量破紀錄!Llama家族暴漲10倍,開源帝國掀AI革命

2024-08-31科技

編輯:桃子 好困

【新智元導讀】 誕生一年半, Llama 家族早已穩坐開源界頭把交椅。最新報告稱,Llama全球下載量近3.5億,是去年同期的10倍。而模型開源讓每個人最深體會是,token價格一降再降。

Llama一舉成為世界開源的領頭羊。

截至目前,Llama模型在開源平台HuggingFace下載量近3.5億。

Groq的創始人表示,這也太瘋狂了,想想Linux花了多長時間才達到這個數位?

官博介紹,這一數位,是去年同期的10倍。而且,僅在上個月,模型的下載量超2000萬次。

2023年2月,Llama 1首次亮相,經過多次叠代,到現在已經過去了整整18個月。

而在這僅有的一年半裏,Llama已經從一個最先進的單體基礎模型,發展成為,一個面向開發者的強大生態系。

LeCun還不忘給自家模型宣傳一波,越來越多的大公司、小公司、初創公司、政府和非營利組織,正基於此開發新的產品和服務。

還有高校機構、研究人員和工程師每天都在改進Llama,並提出新的用例。

另外,值得關註的一點是,自今年5月Llama 3.1釋出之後,雲服務商對模型API token呼叫需求,翻了一番還要多。

一些Meta最大的雲服務提供商,從2024年1月到7月,Llama的每月token量增長了10倍。

從微軟雲、輝達、谷歌雲等科技巨頭,到Groq、 Databricks 等初創公司,全都支持Llama模型的使用。

老黃稱,「Llama深深地影響著最先進AI的進步」。

可見,Llama正引領著開源之光。

Llama開源,拉低token價格戰

GPT-4級別模型開源,最先帶來的好處是,token的價格不斷下降。

AI大牛吳恩達在DeepLearning的部落格中,算了一筆賬:

近期,OpenAI官宣降價後,GPT-4o的 token成本,現在是每百萬token4美元。(假設是80%輸入和20%輸入token混合率)

還記得,2023年3月先發GPT-4時,每百萬token的成本是36美元。

部落格地址:https://www.deeplearning.ai/the-batch/issue-264/

17個月的時間,價格相當於每年下降了79%(4/36 = (1 - p)^{17/12})。

如你所見,token價格正迅速下降!

而推動token價格不斷下降的一個因素,便是開源模型(如Llama 3.1)的釋出。

這是因為,API提供商(如Anyscale、Fireworks、Together AI初創公司,以及一些大型雲服務商)並不需要擔心賺回開發模型所需的成本,因此他們可以直接在價格、速度等其他因素上,開啟競爭。

此外,一些芯片公司Groq(快速生成token領先者)、Samba Nova(能以114 token/s速度執行Llama 3.1 405B)、 Cerebras(以1800 token/s速率執行Llama 3.1 8B) ,以及輝達、AMD、英特爾、高通等半導體巨頭,在硬體上的創新,近一 步拉低了模型價格。

Groq發文介紹了,如今支持Llama模型的生態。

「到目前為止,Groq已經使用Llama模型套件和自家LPU Inference,每天向40多萬開發人員提供50億個免費token」。

在構建用程式時,吳恩達發現,根據未來技術發展方向,進行設計是非常有用的,而非局限於當前水平。

基於多家軟硬體公司的技術路線(改進半導體、更小的模型、推理架構中的演算法創新),可以預見的是,token價格還將持續下降。

這意味著,即便你構建的智慧體工作流看起來成本太高,而隨著token價格不斷下降,或許在某個時間,這套方案在未來也變得經濟可行。

假設你建立了一個APP幫助人類,可每秒連續輸出100個token。那如果百萬token 4美元,每小時只花費1.44美元。

這遠遠低於美國,以及許多其他國家最低薪資標準。

Meta挑戰ChatGPT贏得數百萬使用者

小紮希望,到今年年底,讓Meta AI成為全球使用量最多的AI助手,超越OpenAI的ChatGPT。

目前,這一切正朝著他的目標,取得了進展。

據內部2位員工透露,8月初,Meta AI(2023年9月釋出)在釋出不到一年時間裏,收攬了至少4億月活躍使用者和4000萬日活躍使用者。

這些數位從側面反映了,超30億使用者的Meta,每天至少使用Meta旗下的一款套用中的AI助手。

此外還包括,透過Meta AI專屬網站,以及Ray-Ban智慧眼鏡,也收獲了不少使用者。

龐大的使用者群,成為大型科技公司優勢,希望從ChatGPT中奪取一部份市場份額和關註度。

其實,谷歌也向數十億使用者推廣了對話式AI——Gemini,但力度卻不如Meta。

但一些使用Meta應用程式的人,在Facebook、Reddit、X上,抱怨Meta過於激進地推廣AI助手,比如在其APP的鍵盤上添加搜尋按鈕。

有的人還出了一個關閉Meta AI對話 的教程。

出於對使用者參與度的擔憂,Meta員工可能會非週期性討論的一個問題是,是否有些使用者無意間使用了Meta AI。

8月初使用數據顯示,大約10%的月活躍使用者,每天使用助手來回答問題、生成影像和執行其他任務。

而這一比例遠低於Meta的其他應用程式。

Meta此前2月報告稱,80%的月活躍使用者每天至少使用一款自家的套用。

這些數位表明,Meta AI已經是ChatGPT強有力的競爭者之一。

2022年11月,ChatGPT首次推出。截至目前,每周有超2億人使用。鑒於最近的使用數據,Meta AI可能相距不遠。

與Meta AI不同,ChatGPT也是一項盈利的業務模型。

數百萬使用者每月需要支付20美元,成為ChatGPT Plus使用者,才能用上最先進模型撰寫、編程、答問的能力。

數據顯示,ChatGPT訂閱收入,每年大約高達20億美元。

Meta已在今年投入高達400億美金數據中心和其他基礎設施。

而Meta AI被視為,未來公司獲得這些巨額投資報酬的關鍵部份,主要用於開發這一產品的背後大模型Llama。

雖有報道曝出,Meta正推出一個付費版的高級人工智慧助手。

去年9月,Meta剛剛推出AI助手時,人們最初只能透過Instagram、WhatsApp或Messenger上的直接訊息與Meta AI聊天。

今年,Meta開始在各種套用中, 讓其變得更加顯眼、容易存取。

4月,他們將Meta AI添加到其應用程式的搜尋欄和資訊流中,並為其推出了獨立網站meta.ai。

同月,Meta還推出了一個新版本的AI助手,該版本能夠辨識和解析影像,並在其Ray-Ban智慧眼鏡中廣泛套用。

目前,該助手在Meta的應用程式中可用的語言有8種,並在22個國家提供,同時在美國和加拿大的智慧眼鏡中提供英語版本。

開源AI如火如荼

開源AI技術正在迅速發展,推動著生成式AI的重大創新。透過GitHub和Hugging Face等可存取的研究和平台,社群已經啟動了取得突破性成果的計畫。

生態系:穩步增長,走出泡沫化的底谷 期(Trough of Disillusionment)

自2023年第一季度的溫和增長以來,開發者的興趣已經增長並穩定下來,進入了「穩步爬升的光明期」(Slope of Enlightenment)——價值驅動的創新在此增長。

2024年,開源AI中嚴肅的開發者參與(即GitHub貢獻者)仍在繼續增加。

市場分析:開發工具仍是熱門,訓練和監督勢頭正旺

- 開源AI產品初創企業數量顯著增加

2024年,參與開源AI的參與者數量激增,新的參與者如Neum AI和Patronus AI進入了這一領域,而像Vian AI這樣的老牌參與者也為其使用者提供了開源工具包。

- 開發工具仍然熱門;培訓和監控工具競爭加劇

大多數初創企業仍專註於生成式AI的開發工具,這對於構建、部署和管理應用程式至關重要。

然而,圍繞模型訓練和監督用例的初創企業活動有所增加,這表明可能會向在小眾數據上微調模型和增強AI治理的方向轉變。

在開源模型領域,領先者開始顯現,開發的新模型較少,更多的重點放在來自Mistral和Meta等公司的改進和更高效的版本上。

- 開源開發正在縮小與閉源解決方案的差距

開源使得研究更具成本效益和可存取性,促進了來自多元創作者的創新,並且法律限制較少。據統計,有41%的企業使用者傾向於選擇開源來滿足生成式AI的需求。

融資環境:融資步伐加快,規模更大、後期交易增多

過去兩年,開源AI領域已完成60多筆交易,總融資額超過130億美元。這些交易中有超過45%屬於A輪及以上的融資,表明對增長階段投資的強烈關註。

- Deci AI被輝達以3億美元收購

- Scale AI完成了10億美元的F輪融資

- Mistral AI完成了6.4億美元的B輪融資

- Together AI完成了1.06億美元的A輪融資

在開源AI領域中,模型訓練和開發工具是獲得資金最多的細分領域(不包括Mistral和Databricks),占總融資的60%。

其中,輝達參與了8筆交易(包括Scale AI、Mistral AI、Together AI)。

基礎模型:效能差距已縮小

如今,開源和閉源模型之間的基準差距現在比以往任何時候都要小——Meta Llama和Mistral在MMLU上的表現幾乎與GPT-4o相同。

其他開源模型,如Qwen和Yi,也在效能上快速趕上。

為了解決現有評估(如Elo和MMLU)的局限性,Hugging Face於2024年6月正式推出了專註於復雜任務的開源LLM排行榜——Open-LLM-Leaderboard。

在過去的6個月中,隨著新競爭者的出現,開源AI的格局發生了顯著變化。

經過大量數據預訓練的Qwen,於2024年6月在Huggingface Traction上獲得了最高的下載量。

Github:Huggingface、MindsDB和Roboflow非常火爆

GitHub的stars是計畫在GitHub上受歡迎程度的直接指標。

AutoGPT 和ModularML的Mojo在2023年引領了GitHub熱度——自那時以來,多個倉庫已經獲得了顯著的進展。

LeRobot提供基於PyTorch的真實世界機器人模型、數據集和工具,旨在使機器人技術更易於存取。它具有最先進的模仿學習和強化學習方法,提供預訓練模型、人類收集的數據集和模擬環境。

由輝達支持的MindsDB是一個使用企業數據構建AI模型的平台。MindsDB簡化了資料來源和AI/ML工具之間的連線,自動化工作流程以建立客製的AI系統。

參考資料:

https://ai.meta.com/blog/llama-usage-doubled-may-through-july-2024/?utm_source=twitter&utm_medium=organic_social&utm_content=image&utm_campaign=llama

https://x.com/ylecun/status/1829233754876834298

https://www.theinformation.com/articles/metas-ai-assistant-wins-millions-of-users-in-challenge-to-chatgpt?rc=epv9gi

https://synaptic.com/resources/open-source-ai-2024/