當前位置: 華文世界 > 科技

商湯楊帆:尺度定律主導AI叠代,降低門檻才能迎來AIGC套用爆發

2024-05-05科技
編輯部 整理自 AIGC峰會量子位 | 公眾號 QbitAI
「中國有世界上最好最優秀的B端和C端市場,把做AI套用的門檻和成本降下來,就會激發出更大的產業套用空間。」
這是面對AIGC產業套用現狀,商湯科技聯合創始人、大裝置事業群總裁楊帆的最新判斷。
當前,Scaling Laws(尺度定律)仍在主導著AI的技術叠代,與此同時,也帶來了大模型套用投入產出比不夠好的問題。
而商湯的觀察是,AI基礎設施,正是破解這一難題的關鍵。
以上分享來自楊帆在中國AIGC產業峰會的現場演講。為了完整體現楊帆的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發。
中國AIGC產業峰會是由量子位主辦的行業峰會,20位產業代表與會討論。線下參會觀眾近千人,線上直播觀眾300萬,獲得了主串流媒體的廣泛關註與報道。
話題要點
中國AI套用市場潛力巨大,預計今年下半年或明年上半年將迎來爆發式增長。 AI基礎設施的意義在於提供算力、演算法、數據三要素的一體化平台,降低產業創新門檻,啟用AI生態。 未來中國AIGC套用的大規模爆發,很大程度上取決於基礎設施提供方能否有效降低下遊門檻和成本。 AI套用的決勝點在於針對細分場景提供更好的解決方案、把握使用者需求以及最佳化價效比。 打造開放生態的基礎設施和服務體系,降低AI套用開發門檻,啟用更多參與者,是推動AI套用生態長期健康發展的關鍵。 以下為楊帆演講全文。
尺度定律仍在主導AI技術的叠代
大家上午好,很榮幸今天在這裏跟大家分享一下我們最近的工作和進展。
最近兩年,人工智慧伴隨著生成式AI掀起了新的熱潮,國內外對它的關註度都非常高。
過去一年跟很多業界的朋友聊,為什麽國內市場增速沒有那麽快?其實背後的原因很簡單,我們今天的能力還是有差距的。包括一些頭部企業的機器模型能力,也是最近才逐漸接近GPT-4的水平。
但我們也有一個判斷,自去年底以來,中國AI套用的普及程度正在不斷提高,越來越多的新場景正在被發掘。我們預計,在今年下半年甚至明年上半年,中國的生成式AI市場將迎來爆發式增長。
之前跟很多朋友介紹過,2019年商湯在上海臨港投建了一個計算中心。我們當時做這件事情的時候,大部份人持不理解甚至否定的態度:商湯作為演算法和軟體的輕資產研發企業,為什麽投這麽多資產做這樣一個計畫?
回過頭來看,整個人工智慧技術的發展方向和發展方式印證了當時的思考和判斷。
盡管有些業內人士認為人工智慧需要更好的叠代方式,但今天的AI實在是太消耗能源了,從單位能源智慧的角度來看,其效能仍然較弱。
至少到目前,我們看到,一方面,尺度定律還沒有失效,只要把更多更好的數據灌進演算法裏,就能夠形成更強大更通用的智慧。這是目前整個行業內可以明確看到的清晰可行的路徑,尺度定律仍在主導AI技術的叠代。
另一方面,我們也會註意到AI核心的關鍵性產業問題尚未得到解決,就是產業端的投入產出比不夠理想。
今天,大模型研發的投資成本非常高,怎麽讓這些研發投入在市場端產生最大的報酬和價值,是擺在大家面前共同的課題。
在當前AI生產甚至套用成本越來越高的背景下,降低門檻和降低成本就是必然的趨勢,這也是AI基礎設施出現的意義:
一方面,AI基礎設施很好地契合了當前以尺度定律為主導的演算法創新路徑,為更大規模的AI三要素提供了基礎化能力。
另一方面,只有把這些通用能力,不管是大規模算力集群還是模型API,甚至未來圍繞超大規模數據的完整體系,把它做標準化、基礎設施化、服務化,才有可能在未來讓整個AI產業創新門檻更低、價效比更高,讓更多人進來,在上面賺到錢。
我們始終覺得人工智慧的基礎設施,不僅僅是算力中心,而是三要素一體的基礎設施化,這是啟用人工智慧產業生態的關鍵。
這裏也向大家匯報一下商湯臨港智算中心的最新進展。截至去年底,包括臨港在內,我們已建成7-8個互聯互通的算力節點,還有多個新節點在建設中。
這些節點的總算力超過12000P,其中臨港單點算力接近10000P。這樣的超大規模、智慧化的先進AI算力,在當前仍是核心稀缺資源和關鍵能力。
另外我們看到未來芯片產業鏈將出現分化趨勢。從2001年起,我們在芯片層面做了大量工作,與業內很多合作夥伴展開對接和適配。目前臨港中超過15%的算力來自國產芯片,我們相信在未來產業發展過程中,這將創造更多價值。
AIGC套用爆發前提:降低門檻
除了基礎的資源能力外,更重要的是如何幫助企業降低使用門檻,降低使用成本。這不僅僅是提供低成本機器和用低成本的電去提供租賃服務,盡管這也非常重要且必要。
在此基礎上,我們希望透過對AI的理解、在AI軟體方面的沈澱,以及不同層級的軟體產品和服務體系,幫助大家更低門檻、高效率、低成本地進行人工智慧大模型的研發和使用。
這件事我們做了很多年。去年底,沙利文在【中國AI開發平台市場報告】中,將商湯在這個領域的能力定義為全國領先。當然,我們看到業內今天仍在持續地發生快速的叠代和演變,我們希望在新時代浪潮之下,商湯緊跟節奏,持續地往前進步和叠代。
今天很多人做大模型套用的開發時,首先面臨的問題是:在構建自己的模型,或基於開源模型叠代場景化模型時,如何快速地將模型部署為可用的推理服務,並在其後附加套用服務,同時降低推理服務的成本。
大家都知道今天市場上有非常多的模型套用,特別是去年,向終端使用者收費還沒有所付的資源費高,呼叫越多越賠錢,呼叫成本非常之高。
為了解決這一問題,我們提供了全套的解決方案,包括多層次的架構、工業化的呼叫。我們透過混合模型的呼叫方式,包括訓練與推理的混合,降低了使用者使用模型的成本。這是一個最簡單的方法,也是目前業內大家都在嘗試的:在為客戶提供模型套用時,背後掛載的並非單一模型,而是多個模型。根據語言對話套用、使用者問題的不同以及提示詞設定的不同,模型引擎會在後面選擇呼叫超大模型、中等模型或小模型,從而在最佳化使用者側服務體驗的同時,極大地降低後台資源開銷。
這種方式無疑會增加系統的復雜度。為了降低使用門檻並減少中間成本,我們采用了將所有這一切以標準化管線形式提供給模型和套用開發人員的策略。此外,我們還進行了大量的推理最佳化,包括單位算子和硬體匹配的最佳化,以使同樣的計算任務獲得更好的效能優勢。
在我看來,未來中國AIGC套用大規模爆發的關鍵因素之一,是如何降低基礎設施使用者的下遊門檻和成本。
我們看到中國模型開發還是需要更加強大的生態,這方面落後蠻多的。從商湯的角度來說,我們推出了自己的生態計劃,包括提供算力資源、開發者社群建設,以及基礎的模型能力。我們相信這樣的能力能夠幫助業內更好地提升最終在終端的場景價值。
中國有世界上最好最優秀的B端和C端市場,當我們把做AI套用的門檻和成本降下來,就會激發出更大的產業套用空間。
除了提供基礎設施,商湯自己也在開發大模型,擁有一套完整的日日新大模型體系。
商湯過去做電腦視覺業務比較多,更擅長相關演算法,所以在語言類任務之外,現在更多關註於3D影像、視訊、三維重建等領域,希望在其中貢獻更多行業模型。在過去幾個月,我們已經可以拿AI模型實作三維場景的制作。
大模型下一步發展的關鍵性挑戰是世界知識。除了在電子裝置裏學習人類歷史上的知識,大模型如何更好地感知現實世界、形成更深入的理解並提供有效反饋,也是今年大家重點關註的領域和方向。第一步還是對於現實世界資訊的收集、理解以及重建。這方面我們做了很多探索,把這樣的能力套用到傳統線下文化、旅遊、社交場景,能夠提供很多價值。
我們可以看到,AI大模型能夠推動的場景還是非常多的。從商湯的角度來講,還是希望以自身的基礎設施和平台化能力,支撐更加繁榮的場景生態。
我們透過過去十年AI產業探索獲得的關鍵認知是:人工智慧的未來發展和套用成功的決勝點,並不僅僅在於技術本身。當越來越多的企業和平台提供開源或閉源的模型服務時,AI套用的關鍵在於誰能在細分場景中提供更好的解決方案,誰能更準確地把握使用者需求,誰能打造出更高的價效比。
從這個角度來看,我們這一代人的核心使命,或許就是要打造一個能夠為開放生態賦能的基礎設施和服務體系,以此降低AI套用開發的門檻,吸引更多創業者參與進來。
每個人在不同行業、不同場景、不同領域都有自己的專長和優勢。他們中的許多人可能並不精通AI核心技術,也沒有雄厚的資源投入到AI基礎能力的研發中,但只有啟用這些參與者,AI套用生態才能形成長期、持續、健康的發展。這也是商湯希望與在座同仁以及量子位這樣的平台共同推動的目標。
以上就是我今天的分享,謝謝!