騰訊混元降價對標GPT-4o，湯道生：殺手級套用仍在探索

2024-09-06科技

「過去一年，我們看到數碼經濟在不斷發展。一年來，我們透過持續聚焦自研，推動被整合，業務更加健康可持續：與夥伴共同服務的客戶數，超過200萬家；訂單過百萬的夥伴數量，實作了兩位數的增長；很多SaaS夥伴收入增加了1倍多；國際業務增速也在兩位數以上」。

9月5日，在2024 騰訊全球數碼生態大會上，騰訊集團高級執行副總裁、雲與智慧產業事業群 CEO 湯道生披露了騰訊雲過去一年的成績。同時湯道生還提到，多個行業出現了「內卷式競爭」，不惜虧損也要打價格戰，同時新技術的叠代也加劇了焦慮，企業都擔心在行業技術升級浪潮中掉隊，結果可能被使用者拋棄、被市場淘汰。但指望大模型給一般企業在短期內帶來巨大變化看來並不現實，用人工智能在已有業務場景中降本增效、提高經營效率，從量變到質變來加強市場競爭力，應該是更腳踏實地、行穩致遠的可靠路徑。

在大會上，騰訊雲還釋出了 AI infra品牌「騰訊雲智算」，提升企業部署大模型套用的效率，從機器上架到開始訓練可以做到只需1天；同時還推出了RAG解決方案，支持企業用多種技術「量身客製」AI大模型套用，進一步拓展了AI套用的靈活性和適用範圍。

對於目前殺手級AI套用仍未出現的情況，湯道生對南都記者表示，目前各家廠商對殺手級套用的探索目前仍在早期，仍有較大探索空間。

降價一半對標 GPT-4o ，騰訊混元再升級

「從經濟大環境來看，挑戰確實不少。一些行業因為前幾年的過度投資，導致出現供求失衡，大家為了保住銷售規模與市場份額，出現了‘內卷式競爭’。新技術快速叠代和套用，也在一定程度上加劇了大家的焦慮。因此，企業也必須積極投入研發與創新，確保抓住下一個機會的入場券。」9月5日，在2024騰訊全球數碼生態大會上，騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生提到。

大模型行業今年以來的價格戰尤為激烈，在各家大模型技術快速叠代的同時，所謂「內卷式競爭」不時出現。9月5日 ，騰訊宣布推出新一代大模型 「混元 Turbo」 ，相比前代模型，騰訊混元Turbo效能顯著提升，訓練效率提升108%，推理效率提升 100%，推理成本降低 50%，效果在多個基準測試上對標GPT-4o，且第三方測評居國內第一。

騰訊方面透露，混元Turbo已經在騰訊雲上線，輸入和輸出價格只有前代模型的一半。企業和開發者可以透過API、專屬模型、精調模型等方式使用混元大模型相關能力。

據介紹，騰訊已經構建起了全鏈路的大模型產品矩陣，包括底層基礎設施、幫助企業訓練專屬模型的TI平台和行業大模型解決方案，自研的混元大模型，構建套用的平台工具，以及基於大模型的各類智能套用。目前，騰訊已經有700多款產品接入混元大模型，包含騰訊元寶、騰訊雲、QQ、微信讀書、騰訊新聞、騰訊客服等。此前，騰訊旗下協作 SaaS（軟件即服務）產品已全面接入騰訊混元大模型。

會上，騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲還表示，大模型已經在全球發展了兩年，目前呈現出兩種趨勢，一是模型效能不斷提升，圍繞著模型的產品使用門檻變得更低、更加易用；二是企業積極探索大模型與自身業務場景的結合，大模型的落地場景變得更豐富、更縱深。

吳運聲介紹，基於全矩陣的大模型產品，騰訊已經服務了眾多客戶，在知識管理、智能客服、研發提效、智能行銷、內容生成、辦公協同、風險管控等場景中，幫助企業實作了降本增效和業務創新。

加碼 AI 基建， 提高企業算力套用效率

在騰訊全球數碼生態大會上，騰訊雲還正式釋出AI infra品牌「騰訊雲智算」。作為一個高效能智算底座，騰訊雲智算整合了騰訊雲高效能計算HCC、高效能雲端儲存、向量數據庫、智算套件等優勢產品，能夠為AI創新輸出效能領先、多芯相容、靈活部署的智算產品能力。

何為AI infra？AI Infra是一套包括構建、部署和維護人工智能系統所需的硬件、軟件和服務的組合，概念類似於過往的paas，能處理數據準備、模型構建、模型產品三個層面的問題。

在大模型時代，企業存在著大模型套用對高效能計算和儲存的迫切需求。在這其中，做模型基礎設施的廠商提供的價值就在於，為開發者提高算力套用效率，降低大模型的部署成本、提高部署效率，抓住AI時代的發展機遇。

在這方面，騰訊集團副總裁、雲與智慧產業事業群COO兼騰訊雲總裁邱躍鵬透露，目前透過整合軟硬件技術能力，騰訊雲智算集群從機器上架到開始訓練可以做到只需1天，相比業界以月為單位也大為縮短。

「比如，大部份公司搭建集群，從上架到開始訓練，是以月為單位，我們把這個流程最佳化到1天。去年集群搭建後，第二天就開始做騰訊混元的訓練任務。在業界非常關註的效能上，騰訊雲智算的集群，千卡單日故障數只有0.16，是meta的1/3；在數據讀寫效率方面，1分鐘就能完成萬卡checkpoint寫入，是業界的10倍；千卡集群的通訊時間占比，也降低到6%，是業界一半。」邱躍鵬提到。

除了部署效率與成本，企業經常頭疼的問題還有模型能力怎樣與套用場景更好結合。業界的解決方法是做RAG（結合檢索與生成能力的人工智能技術）來提升落地效果。騰訊雲也釋出了RAG解決方案，以兩種解法來提供RAG技術，一種傾向於輕程式碼模式，少量或不用重寫程式碼就可以構建AI問答套用；一種則是支持多模態資料來源的形式，騰訊雲在其中提供向量數據庫，檢索能力是業界的兩倍。

湯道生：殺手級套用探索仍在早期

湯道生還提到，隨著大模型與生成式AI的技術突破，圖片、影片、語言的理解與生成已經有很大進步，人與人的溝通、人與系統的互動方式，都可能會被重塑。最近半年，產業界對AI大模型的關註重點，開始從模型技術本身，轉到智能套用落地上。用人工智能在已有業務場景中降本增效，提高經營效率，是行穩致遠的可靠路徑。

不過，盡管業界吆喝十分賣力，但目前仍未出現真正可以稱得上「殺手級套用」的AI產品。

湯道生對南都記者表示，一款真正能稱之為國民級的套用更可能首先在C端誕生，目前在資訊搜尋、情感陪伴等領域都有廠商在做嘗試。「（國民級套用）可能在資訊搜尋領域出現，比如我們有元寶，我們也在探索怎樣給使用者更方便、便捷的獲取資訊的互動方式，比如微信讀書推出了‘AI問書’功能。行業裏也有其他玩家，從不同的角度去切入 C端套用，比如情感層面，或者角色扮演。」

湯道生認為，目前還沒有國民級套用出現，很大程度上也許是因為消費互聯網走到今天已經變得越來越成熟。「你能想到的需求，你能想到的場景，可能都已經有一些服務廠商在裏面深耕了很長時間。」

此外對於B端領域，湯道生則對南都記者表示，各家對殺手級套用的探索目前仍在早期，仍有較大探索空間。「TO B我覺得還比較早，場景很多，但是需要大家想到底用什麽架構、怎樣利用好企業內部的數據、到底解決什麽問題、用什麽方式等方面的問題，這裏還有很大的空間去探索。」

湯道生表示，過去很多技術都會經歷玩家興奮湧入投資、泡沫破裂、少數人保持信念堅持的周期，但新技術的變革需要時間去沈澱、積累甚至需要等第一波資本去驅動，逐漸等到不專業的玩家被淘汰，這時行業會回到理性、務實的態度，找到實際的場景和痛點去打磨。

類似地，目前行業還需要更多耐心。「今天的技術也許在某些場景，大家可能覺得只做到了50分或60分，要到90分必須要時間去磨。我相信最後還是那些能堅持的、長期主義的企業能獲得回報，而不是那些因為概念很熱就一股腦投進去的企業，這樣的做法也很難堅持下去。」湯道生表示。

采寫：南都記者 林文琪