商湯財報解讀：落地「模型即服務」商業模式，生成式AI技術已賦能金山等

2024-03-27科技

作為最早投入人工智能基礎設施的公司，商湯（00020.HK）憑借「大裝置+大模型」的前瞻性戰略布局，在2023年斬獲生成式AI業務的爆發式增長。

3月26日，商湯公布2023年經稽核的全年業績。2023年，商湯實作營收34.05億元（人民幣，下同），毛利15.01億元。這一年，商湯明確了新的三大業務板塊：生成式AI、傳統AI和智能汽車，分別對應提供生成式AI的模型訓練、微調及推理服務業務，傳統智慧城市、智慧商業與智慧生活的非生成式AI業務，以及原智能汽車業務。

其中，生成式AI業務2023年收入達11.84億元，實作了同比200%的飛速增長，總收入占比超達35％。這是商湯成立十年以來，以最快速度實作從無到有，並取得、超過10億元收入體量的新業務。

「生成式AI對商湯來說已不僅僅是技術領域的變革性創新，更成為公司的核心業務。」商湯集團董事會執行主席兼行政總裁徐立表示，「商湯生成式AI業務的增長，得益於各行各業對大模型訓練和推理的廣泛需求，這預示著中國硬科技投資的新周期正式開啟。商湯透過在各業務層面深入融合生成式AI能力，正在贏得新客戶，並推動效率和生產力的全面提升。」

前瞻性布局「大裝置+大模型」，贏得發展「時間視窗」

2023年初，ChatGPT出圈引爆生成式AI發展熱潮，國內AI大模型也如雨後春筍般湧現。隨著AI正式進入2.0時代，生成式AI如何落地與變現，成為所有參與者需要共同思考的問題。商湯已成為生成式AI收入最早突破10億元大關的公司之一，主要是緣於其前瞻性戰略「大裝置+大模型」協同的成功，為商湯其在這場AI爭流賽中爭取到了最佳時間視窗。

早在2018年前後，商湯就開始每年投入數十億到SenseCore大裝置，並建設了臨港AIDC（人工智能計算中心）。可以說，為了建設耗資巨大的AI基礎設施，商湯主動選擇了虧損。商湯這一舉措在當時爭議較大，並沒有取得普遍認同。但2023年生成式AI爆發式發展，智能算力需求激增，商湯所持有的大算力成為行業稀缺資源，證明了商湯決策層的高瞻遠矚。

在大模型方面，商湯起步較早，是國內首個釋出超過千億參數級大模型的廠商。

自2018年起，商湯便致力於AI大模型的研發，有著超過5年的技術積澱和實踐經驗。2019年，商湯就具備了千卡並列的系統能力，使用上千張GPU卡進行單任務訓練，推出了10億參數量規模的視覺模型，實作了當時業界最好的演算法效果。2021-2022年，商湯訓練了百億參數規模的超大視覺模型，相當於千億參數語言模型的訓練量。目前，商湯已成功研發了320億參數量的全球最大的通用視覺模型，實作了高效能的目標檢測、影像分割和多物體辨識演算法，並在自動駕駛、工業質檢、醫療影像等多個領域得到廣泛套用。

憑借著「大裝置」與「+大模型」的先發優勢和協同，商湯成為了業內為數不多的能夠保持大模型高速叠代的公司。

2023年4月，商湯推出了「日日新大模型1.0」版本，這是國內首個千億級參數的大語言模型，同時還包括文生圖、3D內容生成等多種生成式AI模型，成為當時國內最全面的大模型系列之一。

同年8月，「日日新2.0」版本釋出，這是國內首個效能超越GPT-3.5-turbo的大模型。

同年12月，「日日新3.0」版本釋出，基模型的能力進一步提升，率先支持不同模態工具的呼叫。秒畫文生圖模型也升級至百億參數量級，其語意理解能力與影像質感顯著增強，維持了在國內的領先地位，並實作了十倍的推理加速效果。

2024年2月，商湯推出的「日日新4.0」效能顯著提升，在程式碼編寫、數據分析和醫療問答等多個場景中，達到了與GPT-4相匹配的能力水平。同時，商湯預計4月份釋出「日日新5.0」版本，效能全面對標GPT4-Turbo。

此外，商湯還開源了InternLM2-7B與20B兩種不同參數規格的基模型，效能超越了Meta的Llama2和谷歌的Gemma等同級別的開源模型。

商業模式上，商湯推出全新的「模型即服務」，使客戶能夠輕松地在大裝置微調和呼叫各類生成式AI能力，而無需管理底層基礎設施。

正是「大裝置+大模型」前瞻性戰略的堅定實施，為商湯贏得了AI 2.0時代發展的先機。商湯在財報中表示，未來將加快生成式AI的商業化行程和市場滲透，為使用者提供具有最優性價比的生成式AI解決方案。

聚焦生成式AI核心業務，保持新業務爆發延續性

基於生成式AI逐漸著眼於落地與變現，在人工智能基礎設施和「日日新」大模型體系的支持下，商湯也在2023年開始將其生成式AI相關套用產品商業化。

作為老牌AI企業，商湯在AI 1.0時代就積累了大量優質客戶。這些客戶在AI 2.0時代迅速轉換為生成式AI客戶，且在快速落地後帶來背書效應，以此虹吸更多客戶選擇商湯大模型服務。財報顯示，生成式AI業務中超過70%的客戶在過去12個月內是商湯的新客戶，剩下的30%的存量客戶客單價也收獲約50%的增速。截至最新，商湯訂單金額超過千萬元人民幣的客戶數已達到數十家。日日新大模型賦能C端的呼叫量更是呈現出近120倍的增長。

套用場景方面，憑借此前在智慧城市和智慧商業領域積累的客戶資源和場景運用，商湯生成式AI技術在這些場景實作快速套用和推廣。

在智能終端業務方面，商湯的傳感器、AISDK軟件、AIISP芯片賦能的手機數量已經超過了20億台，為商湯端側生成式AI業務的發展提供了廣闊的空間。

在企業Copilot助手領域，商湯大模型處理Excel表格等數據分析能力領先，被金山辦公、海通證券、招商局集團等頭部客戶采用。該模型在SuperClue程式碼評測中榮獲榜首，在上千題的數據分析測試集的精度超過了GPT-4。

根據弗若斯特沙利文【2023年中國AI開發平台市場報告】，商湯在增長指數和創新指數兩大評估維度的綜合評分中位居國內首位。這一成績不僅展示了商湯在生成式AI領域的領先地位，更是對其創新能力和市場擴張速度的國際認可。

商湯在財報中表示，計劃進一步發揮「大裝置+大模型」的深度協同優勢，持續投入「日日新」模型體系的叠代，讓模型能力保持業界領先。同時將致力於實作大模型推理效率提升的「摩爾定律」，透過雲+端結合等創新最佳化策略，讓模型推理成本迅速降低，從而開啟更廣闊的套用前景。

與此同時，商湯將推動算力規模持續增長，以保障生成式AI業務長期發展。

目前商湯管理的算力實作了全國聯網的統一排程，在上海、深圳、廣州、福州、濟南、重慶等地都拓展了新的計算節點，總營運算力達到12000petaFLOPS，上線GPU數量達到45000張。商湯預計，2024年將會更大面積地拓展全國的算力節點，輸出豐厚的「新質生產力」。

同時，出於更全面、長遠的考慮，商湯增加了對華為昇騰、寒武紀等主流國產芯片的適配，以全國產的技術棧，支持大模型的訓練、微調和推理。而實作這一點的關鍵，是商湯參與聯合開發的DeepLink開放計算體系。

DeepLink是連線國產硬件和主流深度學習演算法框架的橋梁和紐帶。DeepLink有300多個標準化算子介面；基本上CUDA能夠支持的AI大模型計算需求，DeepLink也完全能夠支持，覆蓋率在99.5%以上。有了DeepLink，各類國產芯片就可以輕松適配主流的大模型訓練框架和演算法庫，比如PyTorch、DeepSpeed等常見的開源訓練框架，還有商湯推出的OpenMMLab、OpenDILab、OpenGVLab等開源演算法庫，充分發揮國產芯片的效能。

環顧AI大模型行業，商湯的優勢在於多年來的技術沈澱、人才儲備、商業化經驗與客戶基礎，同時擁有業內稀缺的大算力基礎設施，這些優勢有望最終成為商湯生成式AI收入大幅增長的源動力。正如商湯2024年戰略目標之一——推動核心業務盈利，「我們將加快生成式AI的商業化行程和市場滲透，集中資源於生成式AI業務以改善現金流和減少虧損。」