當前位置: 華文世界 > 科技

押註生成式AI,商湯科技要「騰籠換鳥」

2024-04-02科技

進入2024年,大模型和生成式AI的迅速崛起,正在重新定義技術和商業競爭的邊界。在中國市場,有這樣一個問題——誰能成為中國版的OpenAI?

在這個關鍵時刻,商湯科技的2023年財報成為了業界關註的焦點。盡管財報顯示其收入34億人民幣,同比下降11%,這背後實際上是一場深思熟慮的轉型——一次「騰籠換鳥」式的業務結構變化。商湯科技主動縮減了其曾經占主導地位的智慧城市業務,將資源和焦點轉移到了快速增長的生成式AI領域。

商湯科技各業務板塊收入占比變動情況 數據來源:商湯科技財報

這一轉變標誌著商湯科技已經邁入一個全新的發展階段,如此看來,它已經不再是人們記憶中的那個商湯科技了。那麽,商湯科技變成了什麽呢?

AI大裝置+大模型雙輪驅動,生成式AI高速增長

推出大模型的公司很多,但能這麽快透過大模型賺錢的公司卻很少。如果說2023年是生成式AI的技術元年,那2024年就是商業落地元年。而商業落地的成敗,最核心的評價指標就是能否兌現足夠的業務收入。

財報數據顯示,商湯科技生成式AI收入貢獻較多,達到了12億元,增速達到了200%。據悉,這也是商湯成立以來,以最快速度從無到有、超過10億收入體量的新業務。

如何實作?深入分析其業務特征,可以發現,商湯科技在生成式AI領域的增長邏輯,可以歸結為:在感知智能、決策智能的長期積累,加上大裝置與大模型的深度協同。

一方面,技術實力是基礎。

生成式AI的成功商用,核心依賴於其技術的成熟度和實用性。在技術層面,生成式AI需要具備強大的理解、推理和創造能力,這不僅要求模型能夠處理和生成前所未有的復雜數據類別,還要求其能在多變的套用場景中保持高效和準確。

然而,生成式AI面臨的技術難點不少。例如,模型泛化與適應力就是一大難題,雖然當前的生成式AI模型在特定任務上表現出色,但在面對新領域或新問題時,模型的泛化能力和適應力仍有限。模型需要在保持高效能的同時,具備跨領域套用的能力;數據偏差也是一個嚴重問題,可能導致模型生成帶有偏見的結果;生成式AI的強大能力也帶來了潛在的風險,如生成不準確或有害的內容,則可能面臨業務合規的挑戰。要解決這一系列問題,需要深厚的技術積澱才行。

在過去十年中,商湯科技深耕於感知智能和決策智能,積累了豐富的多模態數據資源,這些不僅增強了其基礎模型對物理世界的理解能力,也極大地提升了模型處理多種數據類別的能力。特別是商湯科技推出的「日日新」大模型,在基礎模型構建、多模態理解、程式語言處理、工具呼叫,以及處理百萬字級無失真上下文資訊等方面,達到了業內領先水平。

「日日新」4.0版本在多個套用場景中展現出的能力,如程式碼編寫、數據分析、醫療問答等,不僅與GPT-4持平,甚至在某些方面超越了它。。

另一方面,算力是大模型最大瓶頸,AI大裝置SenseCore成為商湯科技攻城拔寨的「彈藥庫」。

大模型訓練的本質是一個計算密集型過程,對算力的需求極其龐大。這種對算力的依賴,使得掌握足夠算力資源的企業,能夠在生成式AI的研發和套用上取得先機。在這個意義上,算力成為了企業在生成式AI領域進攻和防守的重要「彈藥」。風險資本投資大模型創業公司,最關鍵的就看兩個指標,一個看公司有沒有厲害的人才,另一個就是看公司手裏有沒有足夠的算力。

對於商湯科技而言,其AI大裝置SenseCore的建設和營運,昭示著公司在算力資源配置上的戰略遠見。財報數據顯示,商湯科技的算力規模已經達到了12,000 petaFLOPS,擁有45,000卡GPU。透過龐大的算力支撐,商湯科技成功實作了對萬億參數級別大模型的有效訓練,從而為公司在生成式AI領域的快速發展奠定基礎。

在AI大模型領域,有一個著名的 「尺度定律」(Scaling Law):隨著模型大小(如參數數量)、數據集規模、或計算資源(如訓練時的算力投入)的增加,模型的效能(如準確率、生成質素)通常會呈現出持續改善的趨勢 ,這包括但不限於更好的泛化能力、更強的推理能力和更高的任務解決效率。

尺度定律,推動了AI大模型規模的不斷擴大。然而,模型規模的增加也帶來了算力需求的急劇上升。這要求算力大裝置不僅要有足夠的計算資源,還需要具備高度的可延伸性和彈性,以適應模型規模的快速增長。同時,如何在保證模型效能提升的同時,控制訓練成本,避免算力資源的無效消耗,成為演算法與算力協同過程中需要解決的重要問題。

商湯科技的AI大裝置SenseCore+「日日新」大模型的協同,則是遵循尺度定律的典型案例:「日日新」大模型在萬卡算力的保障下,遵循尺度定律不斷提升效能;而源於大模型研發的深刻理解,幫助商湯更有前瞻性地設計基礎設施,實作領先同行的算力效率和彈性。

需要指出的是,商湯科技所實作的這種協同,不僅是簡單的演算法最佳化和硬件升級,而是一個涉及計算架構、模型設計、演算法效率和資源管理等多個層面的復雜系統工程。算力大裝置的設計需要考慮到模型架構的特點,以及模型訓練和推理過程中的計算需求。這意味著,計算架構必須能夠靈活適應不同的模型設計,支持平行計算、分布式訓練等技術,從而實作模型訓練的高效率和低成本。同時,大模型的設計也需要考慮到算力的限制,透過模型壓縮、量化、稀疏化等技術降低對算力的需求,提高模型的運算效率。透過改進模型訓練演算法、引入更高效的最佳化器和排程策略,可以在不增加額外算力的情況下提升模型的訓練速度和質素。

聚焦大模型推理,快速推進商業落地

上面,我們分析了商湯科技的基本能力。要實作可持續發展,需要將這些能力實作商業落地。一個公司要在市場中立足,首先是要找到自己在產業中的位置。那麽,商湯科技將自己定位在哪裏呢?

商湯科技董事長兼CEO徐立,在2024全球開發者先鋒大會(GDC)中提出的「大模型能力的三層架構」理論,為理解商湯科技的大模型套用策略,提供了重要視角。

一般來看, 大模型可以分為三層能力框架,分別是知識層、推理層和執行層。

其中,第一層是知識層,大模型透過對海量數據的學習,吸收世界知識,形成對不同領域知識的全面理解。第二層是推理層,在知識層之上,推理層使得AI能夠在掌握大量知識的基礎上進行邏輯推理和決策。第三層是執行層,關註如何將AI的知識和推理能力轉化為具體行動,與現實世界進行互動。這涉及到AI在物理環境中的操作能力,如自動駕駛、機器人控制等。

其中,推理層在生成式AI體系中起著至關重要的作用,透過對海量數據中抽象模式的邏輯演繹和推演,推理層使AI能夠在面對未曾遇見的問題時,提出創造性的解決方案。此外,推理過程本身的反饋還能促進知識層的持續最佳化,形成一個動態學習和前進演化的閉環。因此,推理層不僅是AI智能處理的核心,也是實作AI技術深度商業落地和跨越式發展的關鍵。

商湯科技正是聚焦於推理層,將生成式AI深度融入到各個行業和領域中,並取得了不菲「戰果」。在C端,商湯科技的大模型C端呼叫量,在過去半年呈現出近120倍的增長;在金融、醫療、Copilot助手、擬人互動、智能終端等B端套用中,商湯科技的大模型不僅提供了決策支持,更在復雜的數據分析和處理中展現了出色的能力,其客戶涵蓋中國銀行、招商銀行、中國工商銀行等金融機構,上海交通大學醫學院附屬新華醫院、瑞金醫院以及鄭州大學第一附屬醫院等醫療機構,金山辦公、小米、榮耀等領域頭部企業。

商湯科技生成式AI典型客戶

我們可以透過一個具體的客戶套用案例,來看商湯科技的生成式AI技術,如何賦能客戶。

客戶案例:上海銀行,基於大模型打造AI數碼人,降低服務門檻。

上海銀行,在其數碼化轉型過程中遇到了雙重挑戰:一方面,需要在有限的人力資源下滿足日益增長的、多樣化的金融服務需求;另一方面,銀行面臨著如何縮小數碼鴻溝,尤其是對年長客戶群體而言,普及和降低數碼服務的使用門檻成為了迫切需求。這些痛點不僅關系到服務效率和覆蓋範圍的提升,也關乎客戶體驗的全面最佳化。

針對這些挑戰,商湯科技提供了基於日日新大模型體系的解決方案,透過打造AI數碼人員工「海小智」和「海小慧」,深度整合了生成式AI的前沿技術。這兩位AI數碼人員工不僅具備高度擬人化的表達和互動能力,還透過對2000條問答數據和10萬條語料數據的深度學習,實作了對客戶需求的精準理解和響應,顯著提高了服務的可及性和個人化。

目前來看,該方案套用效果顯著,特別是對於上海銀行60歲以上的客戶群體,「「海小智」和「海小慧」有效降低了使用門檻,使得老年客戶也能輕松享受到手機銀行的便捷服務。此外,這一方案還極大地提升了客戶服務的效率和質素,在不增加人力資源的情況下,實作了更高頻次的客戶互動和服務滿足。

商湯科技的天花板,更高了

透過分析商湯科技的發展歷程和其業務特征,我們發現其與OpenAI有諸多相似之處。

OpenAI自2015年成立以來,透過不斷的技術創新,推出了一系列引領行業發展的生成式AI產品,如GPT系列。直到推出ChatGPT,OpenAI迅速出圈,奠定了自己在AI市場的地位。

商湯科技成立於2014年,比OpenAI還早一年「出生」。成立以來,商湯科技也依托其在電腦視覺、深度學習等方面的深厚技術積累,持續推動技術創新。2023年,商湯推出在生成式AI領域的「日日新SenseNova」系列產品,展現了其在AI技術創新上的實力,並迅速實作商業突破。

在直接的大模型競爭方面,商湯科技正加緊追趕OpenAI的腳步。商湯新近釋出的 「日日新SenseNova 4.0」不僅在知識覆蓋、推理能力、長文本理解、數碼推理以及程式碼生成方面實作了全面升級,還引入了支持跨模態互動的能力。

尤其值得註意的是,「日日新·商量」大語言模型通用版本(SenseChat V4)在綜合評測中與GPT-4不相上下,甚至在某些關鍵領域如推理和程式碼編程方面超越了GPT-4。特別是在HumanEval Coding測試中,其一次透過率達到75.6%,超越了GPT-4的74.4%。在醫療領域,「大醫」模型在兩項行業權威評測中均獲得了第二名的好成績,效能接近乃至部份超越了GPT-4。

SenseChat V4與GPT4、GPT3.5對比 數據來源:基於Opencompass full全集測試

看完技術比較,我們再來看看商業化成果。根據【路透社】報道,OpenAI在2023年一整年的營收16億美元,商湯科技營收4.7億美元(34億人民幣,匯率:1 美元 ≈ 7.2 人民幣),約為OpenAI的30%;如果只算商湯科技的生成式AI收入,則有1.7億美元(12億人民幣),超過OpenAI的10%。

而算市值,商湯科技為30億美元(234億港元,2024年3月27日市值),不到OpenAI近1000億美元估值的3%。如果再考慮到商湯科技在生成式AI領域200%的增速,目前商湯科技的價值被嚴重低估。

2024年,商湯科技迎來了10周歲生日,這也成為他轉變的一個契機。商湯在財報中闡釋了下一步計劃,推動業務增長和核心業務盈利,穩健而前瞻地占據AI 2.0時代有利競爭地位。