騰訊混元 視覺中國 資料圖
在「開源」「閉源」爭議在大模型圈沸沸揚揚之際,騰訊官宣加入「開源」陣營。
11月5日,騰訊混元宣布最新的MoE模型「混元Large」以及混元3D生成大模型「 Hunyuan3D-1.0」正式開源,支持企業及開發者精調、部署等不同場景的使用需求,可在HuggingFace、Github等技術社區直接下載,免費可商用。
「開源更符合騰訊的長期主義。」當天,騰訊機器學習平台總監、騰訊混元大語言模型演算法負責人康戰輝在接受澎湃新聞記者采訪時坦言,「開源能支持更龐大的場景落地,更適合客戶實際套用,如果是單一場景會有其他選擇。目前,我們做了大量探索,無論是萬億級、千億級、百億和十幾億級別的場景都可以實作。」
所謂的開閉源,對應兩種軟件開發模式:開源指開放源碼,將原始碼公開釋出並允許任何人檢視、修改和使用;閉源則不公開原始碼,只對外釋出編譯後的軟件。
目前國內大模型廠商已經清晰分為兩大流派:阿裏、騰訊等更傾向於開源,百度、百川智能、月之暗面等則傾向於閉源。自從國產大模型崛起以來,對於開源和閉源的爭議似乎還未有明確定論。
開源和閉源爭議何在?
「今年大模型發展如火如荼,商業模式也是百花齊放。開源更多符合長期主義的選擇,大模型相當於AI時代的作業系統,是底層基礎設施,不是簡單的產品,不存在入口、流量,需要沈下心來長期深耕。」康戰輝表示。
開源PK閉源,誰能勝出?此前多位AI大佬曾就這個問題打起口水仗,例如百度CEO李彥宏曾經多次公開力挺閉源。
在今年的世界人工智能大會上,他表示,開源大模型在學術研究、教學領域等特定場景下有存在的價值,但並不適用於大多數套用場景,「當你處在激烈競爭的環境中,需要讓業務效率比同行更高、成本比同行更低,這時,商業化的閉源模型是最能打的。」
但360創始人周鴻祎、百川智能CEO王小川等人卻支持開源。周鴻祎提及開源大模型時稱,他一直相信開源的力量,至於網上有些名人胡說八道,大家也別被他們忽悠,說開源不如閉源好,「一句話,今天沒有開源就沒有Linux,沒有Linux就沒有互聯網,就連說這話的公司自己都借助了開源的力量才成長到今天。」
阿裏雲CTO周靖人也公開表示,開源社區已經蓬勃發展起來了。阿裏雲的初衷不是把模型攥在自己手上去商業化,而是幫助開發者,開源生態對促進中國大模型的技術進步與套用落地,以及生態的蓬勃發展至關重要。
「開源與閉源表面上呈現為兩種不同的技術路徑,然而從本質上看,二者是商業模式層面的爭議點。」人工智能專家、天使投資人郭濤向澎湃新聞記者介紹。
諸如阿裏巴巴、騰訊等大型企業,其核心業務聚焦於雲服務供應,該業務處於大模型產業鏈的上遊環節。此類大廠選擇模型開源的戰略意圖在於,憑借免費的下遊產品吸引開發者,繼而促進數據的消耗量,以此推動上遊雲產品使用量的增長。
反觀選擇閉源的企業,其中大部份為專註於大模型的創業公司。這些公司以人工智能為核心業務領域,期望透過大模型實作盈利,故而更為關註閉源模型的價值。當前,閉源大模型主要是依據應用程式編程介面(API)的呼叫頻次(即使用量)來實施計費。相較於開源模式,閉源商業模式在獲取收益方面看似更具優勢,不過,其在短期內能否達成盈利目標仍需進一步觀察。
「AGI是不歸路」
目前,對AGI(通用人工智能)的追求已成為AI行業的共識,AGI最早的定義是未來會具備人類一樣的自我意識,那將是對人類產生終級挑戰的物種。
業內普遍認為,通往AGI的道路是Scailing Law(縮放定律),即數據越多,模型越好。康戰輝告訴記者,目前Scailing Law仍然成立,但是確實有放緩的趨勢,算力資源的限制也在制約大模型的訓練規模不斷擴大,業界都在思考怎麽降低訓練大模型的成本,「AGI是一條不歸路。」
在他看來,中國做大模型有很多自身優勢,首先在場景上非常豐富,其次,國產大模型在精細化打磨上更有能力,從長期來講對於國內AI研發能力非常有信心。
公開資料顯示,騰訊此次宣布來源的混元Large是目前開源領域參數規模最大、效果最好的MoE模型,而騰訊混元3D生成大模型則是業界首個同時支持文字、影像生成3D的開源大模型。兩個模型均屬騰訊自研,目前,兩個模型均已經在騰訊業務場景中落地套用。
值得註意的是,此前智譜AI釋出智能體功能,曾經引發AI概念股震動,對於智能體的概念,康戰輝表示,智能體一定是未來趨勢,將會使大模型從知識內化向外化轉變,但是目前智能體的相關研究依然比較復雜,產品也相對初步,未來仍然有很大的探索空間。
澎湃新聞首席記者 範佳來
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)