當前位置: 華文世界 > 科技

生成式AI強勢崛起 中國大模型企業憑何致勝未來?

2024-09-04科技

導語:在國內所有的AI技術服務商當中,商湯可以算是最特殊的一個。

8月27日,港股上市的AI科技公司商湯科技(00020.HK),釋出了2024年中期業績公告。

財報顯示,2024年上半年,公司總體收入為17.4億元,同比增長21.4%,三大業務當中,來自生成式AI的收入為10.5億元,同比大幅增長255.7%,收入貢獻占比達到60.4%,成為商湯的第一大收入來源。在生成式AI業務的強勢帶動下,上半年集團整體毛利達到7.7億元,同比增長18.2%。

生成式AI的強勢崛起,成為商湯新的收入支柱和增長來源。

放眼全球,AI行業仍處於投入遠大於產出的早期發展階段, 如何利用AI技術賦能傳統商業模式,實作可持續的商業營收,是擺在整個行業乃至AI科技革命面前的共同挑戰。

在所有人都在努力尋找答案的背景下,為什麽商湯可以憑借生成式AI獲得顯著的營收增長?這是個值得思考的問題。

01 商湯靠什麽?

今年以來,隨著大洋彼岸輝達(NVDA.US)股價和業績的狂飆突進,許多人驚訝的發現,來自於生成式AI領域的算力和服務需求,正在以令人瞠目結舌的速度迅速增長。

而在中國市場,這樣的需求同樣在以驚人的速度爆發。IDC報告預測,未來五年,中國AIDC服務市場以高增速持續增長,預計年均復合增長率達57.3%,2028年整體市場規模近2000億人民幣,其中訓練側算力需求將增長10倍以上,而推理側算力需求更將增長200倍以上。

那麽,商湯科技財報中所說的「生成式AI業務」,具體包含了哪些業務呢?

想要回答這個問題,我們需要回到業務基本面當中尋找答案。

首先,毋庸置疑,商湯是AIGC領域重要玩家之一,旗下的日日新大模型是國內綜合效能比較先進的大模型產品之一。

作為大模型服務商,商湯為諸多客戶提供了大模型能力呼叫的支持,因此,這部份業務所產生的收入,自然成為了商湯生成式AI營收的組成部份之一。

但對於商湯的業務版圖來說,對外提供大模型能力呼叫服務,這僅僅只是生成式AI營收構成中的一部份。而另一個核心組成部份,則是SenseCore商湯AI大裝置。

什麽是商湯AI大裝置?

簡而言之,商湯AI大裝置,是商湯自己使用同時也提供給第三方客戶的、用來訓練AI大模型的一整套基礎設施,這其中包含了硬件和基礎設施如GPU和AIDC等,也包含了諸多由商湯自行研發的軟件及演算法。

實際上,整個商湯AI大裝置SenseCore包含了三層結構:算力層,包含AI芯片及處理卡,以及安置這些硬件的AIDC相關設施;平台層,包含大模型的訓練和數據管理所需要的諸多支持軟件及後台程式;演算法層,則是商湯提供給客戶使用的演算法工具箱以及輔助開發的框架。

無論是AI算力的硬件,還是平台和演算法層面的各類工具和框架的使用,這些資源整合到一起,成為可以讓客戶隨意使用的統一的大模型業務平台,讓客戶可以在最短的時間、用最低的成本去訓練屬於自己的大模型,這就是商湯AI大裝置的存在價值所在,也是商湯可以在生成式AI市場獲得差異化競爭力的基礎。

02 AI組合拳:大模型+大裝置

在商湯的管理團隊看來, 公司最大的有利競爭,來自於大模型加大裝置的有機協同。

商湯集團董事會執行主席兼行政總裁徐立博士表示:「生成式AI迎來黃金發展時期,我們正處於下一波增長的有利位置。商湯核心優勢在於‘大裝置+大模型’深度協同,具備打造對標一流的大模型能力,在原生多模態、影片流自然互動、以及低成本模型推理架構上構建獨特的優勢,從而在激烈的市場競爭中脫穎而出。」

作為「大模型+大裝置」協同戰略的組成部份,商湯對於AI大裝置SenseCore的研發由來已久——實際上,早在2018年,商湯就啟動了大裝置的相關建設。

在AIDC的建設方面,商湯建設並營運的上海臨港AIDC是亞洲最大的人工智能算力中心,2024年上半年,商湯營運的總算力高達20000PetaFLOPS,GPU規模超過5.4萬張,穩居行業領導地位,能夠支持高達2萬億參數的MoE多模態模型的穩定高效訓練和推理。

在平台的升級和最佳化方面,在推理場景中,商湯創新的技術架構能夠實作在相同算力及電力成本下的每秒請求數(QPS)提升4倍,並支持推理服務彈性按需伸縮,進一步最佳化了大規模AI推理的整體成本。此外,基於原創的訓推一體、算電協同等技術創新,商湯持續提高萬卡集群的GPU資源利用率至最高80%以上,大振幅提升AIDC的整體營運回報率。

而作為「大模型+大裝置」協同戰略的另一極,在大模型的叠代和發展上,商湯同樣快馬加鞭。

今年上半年,商湯的「日日新」大模型叠代至5.5版本,綜合能力顯著提升,在多模態和即時互動體驗方面實作了對標GPT-4o的效能,為AI套用層的開發提供了最好的大模型基礎底座。

據財報顯示,上半年,商湯日日新大模型的整體呼叫量實作了400%的增長,使用者數和平均呼叫量均大振幅提升;客戶亦遍布互聯網、智能硬件、電動汽車、機器人、醫療、金融等多個行業。

商湯的大模型和大裝置,正在業務層面形成越來越緊密的合力:大裝置作為大模型的底層算力基礎,為日日新大模型的快速升級叠代提供了最基本的保障;而從大裝置上叠代發展起來的大模型,則給不同行業、不同需求的客戶提供了靈活的能力呼叫和需求滿足,讓行業客戶不需要一切從零開始,而是借助日日新大模型成熟的能力,快速的實作自己的業務需求,大大降低了透過AI進行商業流程再造的時間和資源成本。

大模型+大裝置的業務組合,最大限度的滿足了不同預算、不同規模、不同行業的客戶的實際需求,整個上半年,超過三千家客戶使用商湯的AIDC及日日新大模型業務。

03 技術賦能行業 AI創造價值

在生成式AI領域,商湯的客戶既包括了京東、小米、金山等互聯網公司,也包括了像三大電訊供應商、吉利、OPPO等行業領軍企業,甚至還不乏大模型創業公司之類的同行。

對於那些實力雄厚的大公司、大機構,為什麽願意選擇商湯作為自己進入AI領域的首要合作夥伴?商湯的大模型和大裝置,究竟能給這些客戶帶來什麽?

可以透過兩個不同行業的案例,一窺其中答案。

案例一:PathOrchestra病理大模型

在醫療行業,病理診斷被譽為疾病診斷的「金標準」,但長期以來,這個領域一直面臨著病理醫生培養周期長、優質病理診斷資源分布不均勻的問題。即使對於國內三甲醫院而言,優秀的病理醫生都是十分稀缺的人才。

近年來,人工智能技術的套用,讓國內外病理科迎來數智化轉型浪潮,然而,由於數碼病理切片分辨率高、涉及病種多,在「大數據+精標註」的傳統AI模型訓練範式下,想要對每一種疾病進行精標註訓練幾乎是「不可能完成的任務」。

實際上,國內曾經有多家AI企業想要挑戰這一難題,但在經過了多次的調研和分析之後,這些挑戰者基本上都選擇了放棄。

為了解決這一全球性難題,商湯聯合了國內多家頂尖醫療機構和大學研究機構,包括中華醫學會病理學分會王哲副主委團隊、清華大學何永紅教授團隊,共同開始了基於AI的大模型病理診斷技術研發工作。

傳統的醫療大模型的開發流程,需要投入大量的人力進行醫療數據分類、標記、整理等工作,而模型訓練過程中所需算力也是個很大的難題。但對於商湯而言,可以透過日日新大模型的能力,去替代人工進行數據整理和全自動標記;然後透過AI大裝置的靈活配置,解決模型訓練所需的算力資源,相較傳統開發方式,成本更低、速度更快。

功夫不負有心人,在2024世界人工智能大會(WAIC)期間,商湯醫療攜手瑞金醫院、華西醫院、新華醫院、西京醫院、中科大附屬第一醫院、北京清華長庚醫院,共同推出了國內首個病理大模型PathOrchestra,而這也成為目前階段,全球賦能臨床任務最廣的病理大模型。

此次釋出的病理大模型PathOrchestra,是商湯與多家專業醫療機構攜手,利用國內規模最大的近30萬張全切片數碼病理影像(近300TB數據)數據集訓練,並融合了文本、影片等多模態訓練數據,透過對海量數據的自監督學習,讓模型「觸類旁通」學會了分析各類器官病理影像,目前已覆蓋肺、乳腺、肝臟、食管等20余種器官。

在商湯先進AI大模型+大裝置的聯合加持下,PathOrchestra目前已經可以賦能包括泛癌分類、病竈辨識和檢測、多癌種亞型分類、生物標誌物評估等在內的百余項臨床任務,並在多器官泛癌分類、淋巴瘤亞型診斷、膀胱癌篩查等近50項任務中,準確率超過95%。

很多病患,都將從這項開創性工作當中受益。而商湯基於大模型驅動的數智化病理科整體解決方案,也給公司在醫療領域帶來了源源不斷的訂單和回報。

案例二:WPS Copilot Pro

作為國內最資深的辦公軟件公司,金山的WPS是很多企業辦公場景中最常使用的軟件。今年4月,金山辦公正式推出了WPS 365,攜手商湯把基於日日新大模型的辦公套用推到了一個新的高度。

對於現代辦公軟件而言,針對數據的分析、挖掘、整理、視覺化輸出是一項發生頻率很高的工作。經過多年的發展,現代辦公軟件通常內建了強大的數據分析和報表生成模組。但這些功能的使用和連線通常極為復雜,需要專業的開發人員參與,一般的業務管理人員,如果缺乏專業的程式碼開發能力,很難把復雜的API加以妥善運用。

有鑒於此,為了進一步提升WPS辦公軟件的生產效率,降低客戶的工作負擔,金山辦公攜手商湯日日新大模型,推出了WPS 365。與個人版不同,WPS 365聚焦為客戶打造企業大腦,它分為AI Hub(智能基座)、AI Docs(智能文件庫)、Copilot Pro(企業智慧助理)三個組成部份。

其中,AI Hub整合了多種大模型的核心能力,並提供了統一的呼叫介面;AI Docs則將傳統雲文件庫一鍵升級為智能文件庫,讓智能創作來源有依據,完整的文件許可權體系保障資訊不越權。

至於最重要的Copilot Pro(企業智慧助理),它的核心功能,是幫助營運人員使用自然語言驅動BI產品進行數據的分析和處理。利用商湯日日新大模型和WPS 365深度融合的 Copilot 能將自然語言轉換為超強生產力,Copilot Pro將使用者的需求轉化為可執行的Python 程式碼,並呼叫WPS 365 API和企業私有API,自動化的完成相應的數據分析和處理工作,再以視覺化的方式反饋給使用者。

基於商湯「日日新」延伸出的程式碼模型能力打造的WPS大盤數據分析套用,透過對話就能完成數據理解與分析任務

例如,企業高級管理人員想要了解並分析本公司不同工廠員工的出勤情況,只需建立一個智能助手,並接入相應的人力資源API,之後,使用者只需要以自然語言的形式提出分析需求,智能助手就能自動獲取不同工廠的出勤數據,進行綜合分析,並呈現最終的分析結果。整個過程無需技術人員參與,更不需要繁瑣的程式碼開發和維護。

事實上,在過去一年國產大模型如火如荼的探索中,程式碼生成能力往往被視作衡量大模型智慧的關鍵維度。程式碼生成需要高度的抽象思維和邏輯推理能力,並且要求準確的遵循程式碼語言的各項規範。目前在國內的各家大模型當中,商湯日日新大模型的程式碼生成能力最早超越GPT-4,在數據分析、數理計算、邏輯推理等細分領域擁有顯著優勢。

04 屬於AIGC的星辰大海

生成式AI下一步的爆發式增長點在哪裏?究竟是基礎設施、套用還是開發平台?暫時還沒有人知道確切答案。

在大洋彼岸,以輝達為代表的芯片廠商,已經在這一波浪潮當中吃到了增長紅利;而國內的一眾廠商,也在基於自身不同的資源稟賦和優勢業務,力求抓住這撲面而來的發展機遇。

而在國內所有的生成式AI技術服務商當中,商湯可以算是最具代表性的一個。

其他公司,有的專註於AIDC相關業務,搞AI算力出租的生意,但本質上其實還是傳統IDC的重新包裝;有的做純粹的大模型開發商,把所有資源和精力都用於規模更大、成本更高的大模型的開發和叠代,但是在商業化上還處於非常早期的階段。

而用「兩條腿走路」的商湯,在這個市場上顯示出了足夠獨特的有利競爭。

一方面,與AIDC服務商相比,商湯能夠提供豐富得多的產品和服務支持,讓客戶不需要一切從零開始打造大模型相關的基礎設施,而是能夠借助商湯成熟的大模型生產環境,專註於核心業務邏輯,而不需要為相關的支持和演算法框架操心;

另一方面,與大模型開發商相比,商湯能夠為企業客戶提供更多、更貼近業務需求的選擇,無論是完全依賴於商湯日日新大模型的能力呼叫,還是那些目標更宏大、希望訓練自己私有模型的傳統商業巨頭,商湯都能夠提供全棧式的解決方案,滿足客戶多層次、多階段的需求。

如果說過去二十年,流動互聯網滲透並影響到了千千萬萬個行業的話,那麽未來,將會是AI技術再次重塑和改造商業世界的時代。其中蘊含的機會,數以萬計。

無論AI技術下一步的發展方向往何處去,對於一家專註於長期主義的技術驅動型企業而言,堅守自己在產業鏈中的位置,為客戶創造價值,為行業帶來進步,在確保長期生存並行展的前提下,為公司夯實和擴大商業版圖,這便是正確的發展之道。