當前位置: 華文世界 > 科技

開源VS閉源:國產大模型的路線之爭與商業化挑戰

2024-07-26科技

當地時間7月23日,Meta正式釋出LLAMA 3.1開源人工智能模型。根據Meta提供的基準測試數據,最受關註的405B(4050億參數),從效能上已經可媲美GPT-4和Claude 3.5,標誌著開源大模型的發展再進一程。

有關大模型開源閉源的路線之爭向來是熱點話題。討論日漸激烈化的同時,國內大模型商業化套用正加速落地,開源與閉源間的技術差距也在縮小。

近日,資訊咨詢公司六度智囊接到需求,多名客戶希望就國產大模型發展趨勢對不同專家進行訪談,從而對行業動向有更深入把握。六度智囊是一家商業資訊檢索平台,為客戶提供優質且領先的研究決策支持和專家共享創意服務。目前已實作海外專家50K+,業務覆蓋北美、亞洲、歐洲、東南亞等地區。

根據六度智囊促成的訪談來看,不少專家認為,行業頭部大模型商業化路徑已較為清晰,根據自身優勢而各有側重。但在商業化套用落地及算力供給方面,國產大模型仍面對一定挑戰。

路線之爭

今年7月,2024世界人工智能大會(WAIC 2024)期間,百度CEO李彥宏有關「開源模型是智商稅」的言論再度引起關註。

李彥宏認為,同樣參數規模下,開源模型的能力不如閉源,「如果開源模型想要在能力上追平閉源模型,就需要更大的參數規模,這將導致更高的推理成本和更慢的反應速度。」

此外,相比原始碼公開傳統的軟件開源,大模型的開源更為復雜。按照李彥宏的說法:「模型開源只能拿到一堆參數,還要在做SFT、安全對齊,即使是拿到對應原始碼,也不知道是用了多少比例、什麽比例的數據去訓練這些參數,無法做到眾人拾柴火焰高,拿到這些東西,並不能讓你站在巨人的肩膀上叠代開發。」

這並非李彥宏第一次在公開場合發表類似觀點,今年4月,李彥宏也曾提出「開源模型會越來越落後」。隨後不久,360集團董事長周鴻祎在公開場合發出反對聲音稱,如果沒有開源文化,就不會有Linux、PHP、MySQL等眾多重要的技術成果,甚至互聯網的發展也會受到極大的限制。

也有部份觀點認為開源與閉源並非對立的關系。百川智能CEO王小川表示,開源和閉源並不像手機中的iOS或者安卓系統只能二選一,從tob角度開源閉源都需要。他預計,未來80%的企業會用到開源大模型,因為閉源沒辦法對產品做更好的適配,或者成本特別高,閉源可以給剩下的20%提供服務。二者不是競爭關系,而是在不同產品中互補的關系。

路線之爭的背後往往是商業路線的分歧。大模型開源的動力首先來源於擴大自身影響力及市場份額的需要。此外,吸引更多的開發者參與到開源模型的改進和最佳化中來,有利於大模型快速叠代與發展,並為企業提供寶貴的生態價值。

華泰證券研報認為,產業化方面,閉源大模型的長期服務能力更強、更可用。大模型與業務結合,需要產品、營運、測試工程師等多種角色共同參與,同時大模型的長期套用所需的算力、儲存、網絡等配套都要跟上,開源社區無法幫助使用者「一站式」解決這些細節問題。

盡管從目前來看,閉源大模型整體能力更強,OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra都是閉源。但開源陣營的日漸壯大,確實給閉源模型帶來了一定沖擊。

2023年5月,來自谷歌一位工程師在內部撰文稱,開源大模型迅猛發展,正在侵蝕OpenAI和谷歌的陣地。他在檔中寫道,開源模型更快、可客製性更強、更私密,而且功能性也不落下風。「當免費的、不受限制的替代品(開源模型)與閉源模型質素相當時,人們不會為受限制的模型付費。」

華泰證券研報認為,隨著以Llama為代表的高效能開源大模型的出現,對於垂直行業套用公司來講,從頭訓練大模型的模式的意義正在下降,部份垂直套用公司轉而采取開源模型+向量數據庫的形式,解決特定套用場景和問題。總的來說,開源模式將蠶食閉源模式一定的市場份額,兩者在未來較長一段時間內或將形成相互搖擺的博弈格局。

目前,在國內大模型廠商中,只有百度、月之暗面等堅持閉源,包括阿裏、商湯、百川智能、智譜AI在內的更多的玩家則開源與閉源兼顧。

商業化加速

盡管圍繞大模型開源與閉源的路線爭論從未停歇,但行業仍存有一種共識:沒有「最後一公裏」的套用與商業化落地,開源與閉源都將失去意義。

2024年以來,大模型企業的商業化落地明顯加速。在六度智囊促成的一次訪談中,前任阿裏巴巴達摩院(北京)科技有限公司商業化高級營運專家表示,目前來看,行業頭部大模型商業化路徑已較為清晰,根據自身優勢而各有側重。

「例如,智譜AI主要集中在to B(對企業)和to G(對政府)市場,這表明它們更傾向於與企業和政府機構合作。而Kimi則選擇了不同的路徑,它們走的是to C(對消費者)路線,直接面向普通消費者。通義千問的策略則與阿裏雲有相似之處,在商業化維度上保持一致。同時,通義千問更傾向於服務大型企業(to大B)和政府機構(to G),而對於消費者市場(to C),則由它們的營運團隊在日常業務中順帶處理。」

在業內人士看來,目前,大模型的B端套用需求相對明確和穩定,包括按照時間段收費、按呼叫量收費以及各種包含硬件的一站式解決方案。然而,在六度智囊促成的前述訪談中,前任阿裏巴巴達摩院(北京)科技有限公司商業化高級營運專家提及:

「評估這些大型模型的商業化落地效果和投資回報率(ROI)是相當困難的,因為它們在不同的套用場景下表現的差異性很大。例如,在政務等特定場景下,這些大型模型的測試效果並不理想。在學習過程中,大模型可能會產生不合規的內容,開發這些模型的公司則需要承擔起相應的風險。」

除ROI(投資回報率)、數據的安全和合規性方面的考量,企業在套用AI時往往還面臨高昂的算力成本。在六度智囊促成的另一次訪談中,前任國際商業機器(中國)有限公司AI技術總監兼資深顧問表示:「以金融行業的AI外呼為例,若要實作1000路並行,並將每次響應時間控制在200到300毫秒之間,需要使用600900張A100 GPU,成本非常高。在算力的邊際成本沒有明顯降低之前,企業使用者仍會保持謹慎態度。」

面向C端商業場景,普通消費者對AI產品的付費意願上漲,但遠未覆蓋大模型研發的成本,行業尚在探索更為高效可行的商業模式。

見識科技釋出的【AI套用需求與付費意願調研報告】顯示,個人使用者對AI套用的付費意願處在增長中,占調研人數中的30.5%。從實際套用中來看,付費意願較強的領域基本集中在文案創作、寫作等與內容制作和傳播相關的辦公領域,其中46%的個人使用者僅願意支付千元左右的費用。

作為To C陣營的中堅力量,月之暗面CEO楊植麟曾表示,目前大模型有兩種主流商業模式中,訂閱是已經被驗證過的、成立的商業模式,但按照使用者數量收費,無法(隨著產品叠代)創造越來越大的價值,不會是最終的商業模式。抽成模式中,廣告已在互聯網平台得到了驗證,但人的註意力和時間有限,這種商業模式的機會也局限。

更長遠來看,大模型的商業化行程將是一個漸進性的過程。前任阿裏巴巴(中國)網絡技術有限公司工程師在六度智囊訪談中表示,「那些業務靠近賺錢能力的公司,比如某些影片平台和手遊公司,可能會率先從大模型技術中受益。最後,大模型在不同行業的套用程度將取決於各個行業現金流業務的規模,那些現金流強大的行業可能會更快地采納並從中獲益。」

算力供給挑戰

自生成式AI熱潮席卷全球以來,AI算力幾乎始終處於短缺狀態。且隨著大模型參數不斷提升,供需緊張的局面大有愈演愈烈之勢。

過去兩年間,美國多次加碼對華芯片出口禁令,又進一步加大了國內廠商的采購難度。2023年10月,美國升級芯片禁令後,A800、H800、消費級產品RTX4090都被納入了管制範圍。2023年底,輝達針對中國市場推出了三款特供芯片:p0、L20和L2。

據【財經】報道,其中效能最強的p0,被認為是目前歐美公司大模型訓練普遍采用的p00閹割版,算力約只有p00的不到15%。國產芯片中,華為芯片目前和輝達相比,在效能和生態上仍存差距。

在六度智囊促成的一次訪談中,前任國際商業機器(中國)有限公司AI技術總監兼資深顧問表示:

「華為910B在字節跳動、科大訊飛、螞蟻集團、美圖公司、百度和小紅書等互聯網企業中被廣泛套用,主要用於推理任務。這些公司出於實際需求,更傾向於使用910B來處理推理工作負載。目前,真正利用昇騰910B進行大規模訓練的使用者主要有兩類:一類是像科大訊飛這樣的企業,他們自建了萬卡集群;另一類是一些政府和研究機構,進行小規模訓練。

由於華為的生態系較為封閉,客戶需要將自己的大模型算子或參數轉換成華為芯片能夠辨識的程式碼才能在910B集上執行,這使得客戶的遷移成本非常高。由於華為無法為每個客戶提供大規模的常駐支持團隊,因此只有那些願意與華為建立深度合作關系的客戶才能獲得全面的支持。」

對於國內GPU芯片的整體供給情況,前任阿裏巴巴達摩院(北京)科技有限公司商業化高級營運專家在六度智囊訪談時表示:「在美國對中國禁售高算力產品如A100、H800、A800等的情況下,相關中國公司已經采取了一些應對措施,在禁令生效前已經進行了采購儲備,以確保他們的營運不會受到立即影響。」

他補充道,在中國市場上,目前的情況是GPU算力總體上是充足的,但算力主要集中在互聯網大廠和專門的GPU智算中心,中小型企業在獲取這些算力資源時能力較弱。「此外,中小型AI公司對於自身算力需求的缺口很難進行準確估算,這無疑增加了他們在市場上競爭的難度。」

綜合專家意見,可以得出以下結論:

行業頭部大模型的商業化路徑已較為清晰,不同的市場策略選擇反映了各公司根據自身優勢和市場需求定的不同市場定位和發展方向。

由於商業化落地效果和投資回報率(ROI)存在困難,在算力的邊際成本沒有明顯降低之前,企業使用者對大模型套用仍會保持謹慎態度。

總體而言,中國市場GPU算力充足但分配不均,中小型企業在獲取這些算力資源時能力較弱。隨著市場需求激增,算力供應問題仍是需要關註的挑戰。