當前位置: 華文世界 > 科技

騰訊混元降價對標GPT-4o,湯道生:殺手級套用仍在探索

2024-09-06科技

「過去一年,我們看到數碼經濟在不斷發展。一年來,我們透過持續聚焦自研,推動被整合,業務更加健康可持續:與夥伴共同服務的客戶數,超過200萬家;訂單過百萬的夥伴數量,實作了兩位數的增長;很多SaaS夥伴收入增加了1倍多;國際業務增速也在兩位數以上」。

9月5日,在2024 騰訊全球數碼生態大會上,騰訊集團高級執行副總裁、雲與智慧產業事業群 CEO 湯道生披露了騰訊雲過去一年的成績。同時湯道生還提到,多個行業出現了「內卷式競爭」,不惜虧損也要打價格戰,同時新技術的叠代也加劇了焦慮,企業都擔心在行業技術升級浪潮中掉隊,結果可能被使用者拋棄、被市場淘汰。但指望大模型給一般企業在短期內帶來巨大變化看來並不現實,用人工智能在已有業務場景中降本增效、提高經營效率,從量變到質變來加強市場競爭力,應該是更腳踏實地、行穩致遠的可靠路徑。

在大會上,騰訊雲還釋出了 AI infra品牌「騰訊雲智算」,提升企業部署大模型套用的效率,從機器上架到開始訓練可以做到只需1天;同時還推出了RAG解決方案,支持企業用多種技術「量身客製」AI大模型套用,進一步拓展了AI套用的靈活性和適用範圍。

對於目前殺手級AI套用仍未出現的情況,湯道生對南都記者表示,目前各家廠商對殺手級套用的探索目前仍在早期,仍有較大探索空間。

降價一半對標 GPT-4o ,騰訊混元再升級

「從經濟大環境來看,挑戰確實不少。一些行業因為前幾年的過度投資,導致出現供求失衡,大家為了保住銷售規模與市場份額,出現了‘內卷式競爭’。新技術快速叠代和套用,也在一定程度上加劇了大家的焦慮。因此,企業也必須積極投入研發與創新,確保抓住下一個機會的入場券。」9月5日,在2024騰訊全球數碼生態大會上,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生提到。

大模型行業今年以來的價格戰尤為激烈,在各家大模型技術快速叠代的同時,所謂「內卷式競爭」不時出現。9月5日 ,騰訊宣布推出新一代大模型 混元 Turbo」 ,相比前代模型,騰訊混元Turbo效能顯著提升,訓練效率提升108%,推理效率提升 100%,推理成本降低 50%,效果在多個基準測試上對標GPT-4o,且第三方測評居國內第一。

騰訊方面透露,混元Turbo已經在騰訊雲上線,輸入和輸出價格只有前代模型的一半。企業和開發者可以透過API、專屬模型、精調模型等方式使用混元大模型相關能力。

據介紹,騰訊已經構建起了全鏈路的大模型產品矩陣,包括底層基礎設施、幫助企業訓練專屬模型的TI平台和行業大模型解決方案,自研的混元大模型,構建套用的平台工具,以及基於大模型的各類智能套用。目前,騰訊已經有700多款產品接入混元大模型,包含騰訊元寶、騰訊雲、QQ、微信讀書、騰訊新聞、騰訊客服等。此前,騰訊旗下協作 SaaS(軟件即服務)產品已全面接入騰訊混元大模型。

會上,騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲還表示,大模型已經在全球發展了兩年,目前呈現出兩種趨勢,一是模型效能不斷提升,圍繞著模型的產品使用門檻變得更低、更加易用;二是企業積極探索大模型與自身業務場景的結合,大模型的落地場景變得更豐富、更縱深。

吳運聲介紹,基於全矩陣的大模型產品,騰訊已經服務了眾多客戶,在知識管理、智能客服、研發提效、智能行銷、內容生成、辦公協同、風險管控等場景中,幫助企業實作了降本增效和業務創新。

加碼 AI 基建, 提高企業算力套用效率

在騰訊全球數碼生態大會上,騰訊雲還正式釋出AI infra品牌「騰訊雲智算」。作為一個高效能智算底座,騰訊雲智算整合了騰訊雲高效能計算HCC、高效能雲端儲存、向量數據庫、智算套件等優勢產品,能夠為AI創新輸出效能領先、多芯相容、靈活部署的智算產品能力。

何為AI infra?AI Infra是一套包括構建、部署和維護人工智能系統所需的硬件、軟件和服務的組合,概念類似於過往的paas,能處理數據準備、模型構建、模型產品三個層面的問題。

在大模型時代,企業存在著大模型套用對高效能計算和儲存的迫切需求。在這其中,做模型基礎設施的廠商提供的價值就在於,為開發者提高算力套用效率,降低大模型的部署成本、提高部署效率,抓住AI時代的發展機遇。

在這方面,騰訊集團副總裁、雲與智慧產業事業群COO兼騰訊雲總裁邱躍鵬透露,目前透過整合軟硬件技術能力,騰訊雲智算集群從機器上架到開始訓練可以做到只需1天,相比業界以月為單位也大為縮短。

「比如,大部份公司搭建集群,從上架到開始訓練,是以月為單位,我們把這個流程最佳化到1天。去年集群搭建後,第二天就開始做騰訊混元的訓練任務。在業界非常關註的效能上,騰訊雲智算的集群,千卡單日故障數只有0.16,是meta的1/3;在數據讀寫效率方面,1分鐘就能完成萬卡checkpoint寫入,是業界的10倍;千卡集群的通訊時間占比,也降低到6%,是業界一半。」邱躍鵬提到。

除了部署效率與成本,企業經常頭疼的問題還有模型能力怎樣與套用場景更好結合。業界的解決方法是做RAG(結合檢索與生成能力的人工智能技術)來提升落地效果。騰訊雲也釋出了RAG解決方案,以兩種解法來提供RAG技術,一種傾向於輕程式碼模式,少量或不用重寫程式碼就可以構建AI問答套用;一種則是支持多模態資料來源的形式,騰訊雲在其中提供向量數據庫,檢索能力是業界的兩倍。

湯道生:殺手級套用探索仍在早期

湯道生還提到,隨著大模型與生成式AI的技術突破,圖片、影片、語言的理解與生成已經有很大進步,人與人的溝通、人與系統的互動方式,都可能會被重塑。最近半年,產業界對AI大模型的關註重點,開始從模型技術本身,轉到智能套用落地上。用人工智能在已有業務場景中降本增效,提高經營效率,是行穩致遠的可靠路徑。

不過,盡管業界吆喝十分賣力,但目前仍未出現真正可以稱得上「殺手級套用」的AI產品。

湯道生對南都記者表示,一款真正能稱之為國民級的套用更可能首先在C端誕生,目前在資訊搜尋、情感陪伴等領域都有廠商在做嘗試。「(國民級套用)可能在資訊搜尋領域出現,比如我們有元寶,我們也在探索怎樣給使用者更方便、便捷的獲取資訊的互動方式,比如微信讀書推出了‘AI問書’功能。行業裏也有其他玩家,從不同的角度去切入 C端套用,比如情感層面,或者角色扮演。」

湯道生認為,目前還沒有國民級套用出現,很大程度上也許是因為消費互聯網走到今天已經變得越來越成熟。「你能想到的需求,你能想到的場景,可能都已經有一些服務廠商在裏面深耕了很長時間。」

此外對於B端領域,湯道生則對南都記者表示,各家對殺手級套用的探索目前仍在早期,仍有較大探索空間。「TO B我覺得還比較早,場景很多,但是需要大家想到底用什麽架構、怎樣利用好企業內部的數據、到底解決什麽問題、用什麽方式等方面的問題,這裏還有很大的空間去探索。」

湯道生表示,過去很多技術都會經歷玩家興奮湧入投資、泡沫破裂、少數人保持信念堅持的周期,但新技術的變革需要時間去沈澱、積累甚至需要等第一波資本去驅動,逐漸等到不專業的玩家被淘汰,這時行業會回到理性、務實的態度,找到實際的場景和痛點去打磨。

類似地,目前行業還需要更多耐心。「今天的技術也許在某些場景,大家可能覺得只做到了50分或60分,要到90分必須要時間去磨。我相信最後還是那些能堅持的、長期主義的企業能獲得回報,而不是那些因為概念很熱就一股腦投進去的企業,這樣的做法也很難堅持下去。」湯道生表示。

采寫:南都記者 林文琪