當前位置: 華文世界 > 科技

潤物有聲V 2023年中國互聯網科技產業發展趨勢報告(三)

2024-05-05科技

AI市場

如果雲服務是根基,那麽AI在未來就是與之緊密配合的武器。

基於預訓練大模型的生成式AI技術

AIGC提升數位化內容生產質效,變革人機互動體驗

2022年,大模型技術研發上的突出進展來自於BEiT-3多模態(視覺-語言任務)基礎模型,包括其在視覺問答、圖片描述生成和跨模態檢索任務上的出色表現。多模態大模型的快速發展為生成式AI (Generative AI,AIGC)技術能力的升級提供了強力支撐和套用產品的全新可能性。2022年,一幅由Midjourney生成的AI畫作【太空歌劇院】橫空出世,後AI生成圖片在社交平台瘋狂傳播;2022年底,AI繪畫熱潮猶在,ChatGPT(ChatGenerative Pre-trained Transformer)又使AIGC這一概念徹底出圈。AIGC是一種全新的內容生產方式,是利用現有文本、音訊檔或影像建立新內容的技術。其使用機器學習演算法,從數據中學習要素,一般基於跨模態大模型打造,包括基於素材的部份生成和基於指令的完全自主生成和生成最佳化。得益於真實數據積累和計算成本下降,可幫助生成數位化內容初稿,產品包括AI繪畫、平面設計、對話系統、搜尋引擎、程式碼生成等,提高了數位化內容的豐富度、生產效率與創造性;類人的互動體驗和全民參與度也提升了C端消費側對於AI的感知,進一步拓寬了市場對AI商業價值的想象空間。

ChatGPT——生成式AI裏程碑

生成式AI的重大突破,通用基礎大模型的勝利

相比之前的生成式對話產品,ChatGPT(ChatGenerative Pre-trained Transformer )在大範圍連續對話能力、生成內容品質、語言理解能力和邏輯推理能力上都得到大幅提升,超出了大眾對於一款聊天機器人的預期,是生成式AI(AIGC)極為關鍵的發展節點。作為一款生成式預訓練大語言模型,「Chat」指向它的功能,「Generative」代表它屬於生成式演算法。生成式演算法在過去數年中受制於RNN的內生缺陷始終發展緩慢,直到2017年 「Transformer」架構出現並解決了傳統RNN模型的問題,生成式AI才開始在預訓練的Transformer架構之上煥發生機,NLP、CV甚至多模態領域通用基礎大模型飛速演進。在模型參數量幾何級數增長以及多種訓練方式的探索之中,ChatGPT橫空出世,也標誌著通用基礎大模型將突破NLP領域以小模型為主導的傳統發展範式。

圍繞新興科技生產力的國家賽局

GPT模型成為科技封鎖和保護主義物件的趨勢初現端倪

國家層面對於目前世界上最優秀(從使用者生態到商業落地層面評估)的AIGC公司——OpenAI和其核心產品ChatGPT的態度也比較慎重。比如,義大利宣布封禁ChatGPT並限制OpenAI處理義大利使用者資訊;中國A股多家企業也釋出公告披露「公司未與OpenAI開展合作,ChatGPT的產品和服務未給公司帶來業務收入」。同時,ChatGPT平台也封禁大量OpenAI帳戶,其中包括部份使用中文進行對話的使用者。作為新興科技生產力, ChatGPT成為科技封鎖和保護主義物件的趨勢初現端倪。從中國所處的追趕者角色看,類ChatGPT產品及其下遊套用產業對於國家數位經濟發展的戰略意義不容忽視。半導體產業「卡脖子」的前車之鑒發人深省,OpenAI的成功再次暴露了中美兩國不僅在AI算力層面差距巨大,在AI演算法和底層框架等層面也存在代際差距。中國AIGC產業發展需立足長遠戰略,布局大模型技術研發、商業落地、生態建設與產業治理。

AIGC助力數實融合世界建設

需前瞻性對技術、數據與生成內容規劃相關行業標準

需求側,隨著數位經濟與實體經濟的加速融合,人類社會經濟生活對數位世界內容的需求不斷提高,牽引各類AIGC套用試水落地;供給側,智慧算力支撐、深度神經網路結構升級、商用基石模型出現、多模態大模型等技術進步驅動了AIGC產品可用性的不斷加強。未來,隨著低延遲網路技術發展,VR/AR等智慧終端裝置規模商用,AIGC演算法能力如視訊和3D內容生成、分布式互動演算法等進一步提升,AIGC將加速助力數實融合世界建設。新技術與數位內容的海量迸發也增加了監管難度,為促進產業有序發展,有關部門及行業協會應在互聯網資訊監管及AI治理的大背景下前瞻規劃。

中國AIGC產業市場規模

市場規模呈指數級增長,突破規模化臨界點攫取萬億產業價值

根據第50次【中國互聯網路發展狀況統計報告】,截至2022年6月,中國互聯網普及率已高達74.4%。 在網民規模持續提升、網路接入環境日益多元、企業數位化行程不斷加速的宏觀環境下,AIGC技術作為新型內容生產方式,有望滲透人類生產生活,為千行百業帶來顛覆變革,開辟人類生產互動新紀元。 艾瑞咨詢預測,2023年中國AIGC產業規模約為143億元,隨後進入大模型生態培育期,持續打造與完善底層算力基建、大模型商店平台等新型基礎設施,以此孕育成熟技術與產品形態的對外輸出。 2028年,中國AIGC產業規模預計將達到7202億元,中國AIGC產業生態日益穩固,完成重點領域、關鍵場景的技術價值兌現,逐步建立完善模型即服務產業生態,2030年中國AIGC產業規模有望突破萬億元,達到11441億元。

中國AIGC產業圖譜全景圖

中國AIGC產業機會前瞻

技術變革:模型層>工具層>算力層>套用層;

資源要素:算力層>模型層>套用層>工具層;

市場機會:套用層>工具層>模型層>算力層;

預訓練大模型的路徑探討

了解人工智慧時代的「ios」與「安卓」,閉源與開源市場將並存互補

在以OpenAI為代表的閉源模型廠商開放對外技術服務後,開源模型廠商也在加緊發力,以Meta的Llama模型為代表陸續開源叠代,意圖進一步實作生態層面的跑馬圈地,2023年上半年LLM與數據集迎來開源季。大模型的開源可根據開源程度分為「可研究」與「可商用」級別。2023年2月,Meta釋出了開源大模型LLM的第一個版本Llama,授予「可研究」用途。2023年7月進一步釋出「可商用」的Llama2版本,雖然有日活超過7億產品需額外申請、不能服務於其他模型調優等的商用限制,但海外很多中小企業已可用Llama2的模型來做私有化部署,基於Llama2開源模型訓練出客製化的可控模型。由於Llama2基本不支持中文,對中國的大模型商用生態暫時不會產生實質性變化,中國仍需開發培育適配於中文數據土壤的開源生態。閉源LLM可為B端使用者和C端消費者持續提供優質的模型開發及套用服務;開源LLM可從研究角度促進廣大開發者和研究者的探索創新,從商用角度加速大模型的商業化行程與落地效果。未來,開源和閉源的LLM會並存和互補,為大模型發展共同創造出多元協作的繁榮生態。

著力打造中國AIGC開源社群生態

輕量級模型陸續開源,助力開源生態建設,千億級模型暫以閉源路徑開展

2023中關村論壇上,科技部副部長吳朝暉表示,中國將堅持開源協作,加強大模型技術持續創新,協同解決透明性、穩定性等共性問題,進一步推動算力資源和數位資源開放共享,加快形成大模型的產業生態。而AIGC開源社群的建設可以吸納更多的開發者及擁有定義使用者的主導權,以AI開源創新平台為杠桿,帶動支撐底層AI芯片、智算中心及雲服務等基礎設施發展。從供給側邏輯來看,大模型開源早期由高校和機構推動,如清華大學的ChatGLM-6B、復旦大學的MOSS,陸續有頭部雲廠商加入,如百度的文心系列與阿裏的通義系列,共同為中國AIGC開源社群的建設「增磚添瓦」,以阿裏雲魔塔社群、百度雲飛槳社群為代表的開源社群建設成果初現,而千億級模型暫以閉源路徑開展,憑借穩定、優質效、完整工具鏈等產品特點定位套用市場;從商業化路徑來看,參考海外明星開源社群Hugging Face的商業模式,中國AI開源社群同樣會先免費提供基礎算力,為客戶提供免費的社群體驗、demo部署及測試,並進一步透過付費服務推播輕量級遷移的微調推理服務或深度開發的訓練調優平台,提升模型產品效能,透過開源社群吸引開發者、企業客戶完成更多部署套用資源的引流變現。

大模型落地將帶來新一輪AI產業化擴散

大模型的落地將提速AI工業化生產,並充分釋放AI產業潛在市場空間

大模型類似於一個能力全面且突出的「完全體」,不僅通用性強,且能力相比小模型有較大提升。因此,用大模型做套用開發,可以采用「預訓練+微調」開發範式,只需要針對具體任務,對大模型進行二次開發、微調甚至只是單純以領域知識庫做輔助,就可以快速賦能套用。相比獨立分散的小模型開發,標準化、流程化程度更高,在開發效率和運維成本上都有較大改善,有效促進了AI的工業化生產。同時,模型能力的提升使得更多AI服務可以落地,有效擴充套件了AI的套用範圍,這些共同促進AI供需兩側潛力釋放。

MaaS是大模型能力落地輸出的新業態

打造大模型商店,為下遊提供低門檻、低成本的模型使用與開發支持

MaaS(Model-as-a-Service),模型即服務,是指以雲端運算為基礎,將大模型作為一項服務提供給使用者使用的新業態。如今,MaaS模式已成為各家雲巨頭廠商發展第一戰略優先級,把模型作為重要的生產元素,依托於既有IaaS設施與PaaS平台架構,為下遊客戶提供以大模型為核心的數據處理、特征工程、模型訓練、模型調優、推理部署等服務。未來,順應大模型開源趨勢,MaaS服務商將著力打造大模型商店平台,發力大模型生態建設,納入更多允許商用的開源模型,提升平台的基模型別及能力,並豐富工具鏈產品服務,透過業務積累、數據回流、模型叠代逐步形成壁壘,在拉高雲服務營收天花板的同時進一步塑造廠商的核心競爭力。

AIGC產業化價值與影響

內容生產和人機互動兩條主線並駕齊驅,拉開變革大幕

本章節所探討的AIGC套用,是以大模型為技術主體,同時涵蓋其他AIGC技術(如語音合成、策略生成)的套用範圍。總體來看,大模型基於其在內容生成、總結、邏輯推理等方面的能力,已在多種AI服務的技術開發環節中展開融合替代。其中,內容生成與理解是大模型的核心能力,AIGC的產業價值主要體現在以此為核心的「變革內容生產方式」與「變革人機互動方式」兩方面。大模型對內容理解和內容生成的雙向能力使其既能以極低門檻實作多模態內容生成,也可脫離內容生產核心場景泛化為一種人機對話的媒介。未來,全行業將借助大模型能力衍生出的大量AI生產工具,實作內容生產效率的飛躍,並進一步降低數位生態的人機互動門檻。

AIGC套用從To B、To C兩端展開

根據AIGC套用的落地場景、技術路徑與產品特征,可將AIGC套用劃分為內容消費與企業服務兩大賽道

AIGC技術的滲透路徑將遵循數位產業的基本發展邏輯,按照客戶型別、產品形態和商業模式,劃分為To C和To B兩個領域。

1)To C產品以內容和工具形式觸達消費者,各類C端套用可透過直接呼叫通用大模型API形成各種AI創作工具,並利用其生成內容進行變現,典型場景覆蓋文娛、影視傳媒行業以及電商零售等。

2)AIGC技術透過大模型能力去部份補充或替代原有場景的演算法小模型或是傳統軟體功能,將其滲透各行各業以提高企業生產辦公效率。更高的場景復雜度對參與廠商的技術能力和行業know-how也提出更高要求,艾瑞將其歸納為企業服務的To B賽道。

全球將大力發展算力基礎設施建設

算力支撐與模型需求存在gap,AIGC的大算力需求讓供需結構進一步承壓

自2017年谷歌提出Transformer架構後,人工智慧發展逐步邁入預訓練大模型時代。2018年6月,OpenAI的GPT模型參數量已經達到1.17億,模型參數量開始實作億級基底的飛越發展,平均每3-4個月即呈現翻倍態勢,由此帶來訓練算力需求也「水漲船高」。算力正在成為影響國家綜合實力和經濟發展的關鍵性要素。浪潮資訊釋出的相關報告表明,計算力指數平均每提高1個點,數位經濟和GDP將分別增長千分之3.3和千分之1.8。面對算力層的供需結構矛盾,各國積極發展算力層基礎設施建設。在計算力指數國家排名中,美國坐擁全球最多超大規模數據中心,以75分位列國家計算力指數排名第一,中國獲得66分位列第二,隨後為日本、德國、英國等國,算力建設已然成為國家高品質發展的戰略級方針。2022年末,在OpenAI的GPT模型湧現能力後,AI產業迅速進入以大模型為技術支撐的AIGC時代,巨量訓推算力需求讓本就供需不平的算力產業結構進一步承壓。目前中國各地正加快新一批數據中心與智算建設,持續最佳化算力資源,滿足未來高速發展的大算力需求。

算力產業模式將在AIGC時代有所演變

智慧算力資源或將更多承載於雲服務產品,以MaaS模式服務千行百業

過去數據中心以租賃與自建為主,算力需求方基於自身業務量級、財務預算情況、數據私密要求等情況進行選擇租賃或自建。在AIGC時代背景下,數據中心將配置更多AI伺服器滿足日益劇增的智慧算力需求,雲廠商更是提出MaaS(Model as aService)模型即服務的商業模式,將雲端運算、智慧算力、模型能力等資源做高度融合,客戶可以直接在雲端呼叫、開發與部署模型,更好適配於客戶的個人化需求。未來,更多長尾企業的需求體量將擁抱MaaS商業模式。相較於雲端算力發展,端側大模型雖然發展較緩,仍是各家終端廠商發展的技術焦點,如從蘋果招聘資訊中可觀測到其對「在端側實作推理和加速大語言模型功能「的人才需求及產品規劃。未來,隨著大模型輕量級開源版本的釋出,大模型有望進行進一步剪裁最佳化,將推理能力部署在端側,並帶動手機、機器人等端側芯片發展。

數據中心需對高速巨量運轉需求做出應對

大模型時代下,數據中心將進一步最佳化網路頻寬、能源消耗與散熱運維等

預訓練大模型的訓練推理需要巨量數據資源與高效能電腦的全天候高速運轉,對數據中心的網路頻寬、能源消耗與散熱運維等能力提出更高要求。首先,網路是數據中心最為重要的組成部份,隨著數據量與計算量的飛漲,數據中心需最佳化網路頻寬,實作數據在節點內與節點間的高吞吐低延遲的傳輸與連線,並進一步最佳化計算集群的架構與設計,保證數據中心的高效利用率;其次,能源消耗與碳排放問題是數據中心亟需關註的重點問題。普通伺服器的標準功耗一般在750~1200W,而AI模型執行時會產生更多的能耗,以CPU+AI芯片(搭載4卡/8卡)異構伺服器為例,系統功耗一般會達到1600W~6500W。根據史丹佛大學釋出的【2023年AI指數報告】數據顯示,GPT-3模型訓練耗費的電力可供一個美國家庭使用數百年,CO₂排放量也相當於一個家庭排放近百年。由此,OpenAI創始人Sam Altma下註核融合公司Helion Energy,向其投資了3.75億美元,Helion Energy也已與微軟簽署購電協定,承諾將2028年之前把世界上第一台商業核融合發電機接入電網,交付給微軟;另一方面,基於大模型算力需求的高能耗執行,其熱量釋放呈現倍增態勢。為了確保伺服器能夠長期處於適合的工作溫度,數據中心將更註重系統設計和散熱技術的發展套用。大模型散熱需求加速由風冷到液冷的技術升級,進一步提升經濟性、節能效果和散熱效率等。散熱也將更貼近發熱源,由機櫃級散熱、伺服器級到芯片級發展。目前,中國大力推進「東數西算」工程,並釋出【新型數據中心發展三年行動計劃(2021-2023年)】等政策性檔,引導新型數據中心實作集約化、高密化、智慧化建設,在AIGC時代下完成中國算力產業在規模、網路頻寬、算力利用率、綠色能源使用率等方面的全方位提升。

AIGC的「達摩凱瑞斯之劍」疑問

技術自身限制+使用者使用不當雖會產生風險隱患,但不可因噎廢食

2022年底至2023年3月,全球科技界都在為此輪生成式AI熱潮狂歡,提振AI產業發展信心的訊息層出不窮:美國科技企業或布局追趕或投身下遊套用開發與生態集合;中國企業也積極布局類ChatGPT、類Midjourney產品開發,國內巨頭紛紛公開大模型研發進展與計劃。但在一片妍妍向榮中,漸漸也有反對的聲音出現:「ChatGPT取代人類」、「AI Risk下ChatGPT的叛逃」、「LLMs助推欺詐和恐怖主義」、「開啟AGI潘朵拉魔盒」等討論甚囂塵上。3月29日,作為OpenAI曾經最重磅的支持者及聯合創始人,世界首富馬斯克與多位科研界大牛發表聯名聲明,基於倫理與設計安全標準考慮,呼籲「所有AI實驗室立即暫停訓練比GPT-4更強大的AI系統至少6個月」將反對聲推向高潮。大模型開發與套用企業也已認識到治理的重要性,例如透過RLAIF(減少人類反饋資訊)、去除危險內容生成、監管框架等手段解決模型偏見、濫用等風險問題。OpenAI也於4月6日釋出【Our approachto AI safety】,應對安全和倫理質疑。作為突圍性產品,ChatGPT的革新價值已被充分印證。雖然其誘發的風險不容忽視,但少數人的「叫停」並不能減緩商業巨頭和產業生態的推進步伐。而AIGC技術也並非是「懸頂之劍」,圍繞其風險與倫理問題的討論與解決方案探索,將助推AIGC產業的永續發展。

AIGC的技術發展:科研與產業兩端突圍

中短期基於Transformer演算法和結構最佳化仍是主流,長期可能被替代

學術界將透過擴大模型參數量、調整模型結構、局部演算法最佳化等方式,進一步探索大模型的能力天花板,觸碰AGI可能性;以各大企業為代表的產業側,一方面從商業化落地角度追求更小模型參數下的高模型能力維持,以及解決大模型出現的知識幻覺問題,一方面也在積極研發探索新模型架構可能性,呈現「對外模型名稱為廠商能力代號,但內含技術架構隨時可能改變」的發展特征。產業與科研兩側的需求都已經暴露標準Transformer架構的巨大瓶頸,即「不可能三角」。各大機構與開發團隊對Transformer架構的成功改進在快速推進,未來極有可能會出現具備推廣價值的新Transformer架構。

AIGC的套用前景:軟硬一體化

大模型低參版本的端側套用,推動手機、機器人等物聯網套用的升級前進演化

大模型在端側的套用,軟硬一體的結合帶來廣闊的套用場景。端側的套用首先需要將大模型進行剪枝、稀疏化等處理,降低參數到十億級規模,同時根據場景進行專屬知識的訓練和微調以適配專門的終端裝置和軟體。這對終端裝置的功耗、記憶體、延遲、成本等都提出了新的要求。具體來看,目前在手機拍照、多終端語音助手、機器人具身智慧(指從第一人稱視角出發,具備理解、推理、並與物理世界互動的智慧系統)等方面表現出套用前景,推動物聯網套用的升級與前進演化。2023年8月,華為推出鴻蒙4引入盤古AI大模型,在消費電子領域賦能;小米官宣13億參數手機大模型;OPPO預計將與阿裏雲聯合打造OPPO大模型基礎設施。手機廠商紛紛入局輕量化手機大模型市場,以期為使用者帶來全方位智慧化體驗提升,也許不久將來大模型套用將成為使用者體驗變革換代的「新觸點」。

AIGC的社會影響:新一波自動化浪潮

AI成為基礎設施,部份基礎工作被替代,社會人力結構和分配方式重塑

技術的躍遷、生產效率的提升並不會自然帶來社會整體福利水平的提升,相反往往以犧牲部份人的利益為前提,進而引發社會結構、分配方式的重塑。AIGC互動界面的使用者友好性、大模型開源及API價格的降低、外掛程式服務帶來的套用生態繁榮等,都使得AI技術或將成為像水、電、網路一樣的基礎設施,滲透並改變千行萬業。然而,大模型具有認知、分析、推理能力,不同於自動化浪潮下對藍領的沖擊,AIGC時代受AI影響最大的可能是初級專業人士和技術人員,即部份白領。據Challenger報告顯示,2023年5月,美國因AI替代造成的失業人數達3900人,且都發生在科技行業。以及據麥肯錫數據預測,到2045年左右,有50%的工作將被AI替代,比此前的估計加速了10年。與此同時,具有創造力、深度思考等高階智力的人才,將享受到AIGC帶來的效率優勢,成為AI的駕馭者,相應的工作需求也會增加。智力要素重要性的提升、附加值的提高,都將推動社會資源和財富向頂尖人才和組織聚集,但社會是一個整體,生產效率的提升並不代表著購買力的提升,被替代的普通職工才是購買力的最大來源,為了維持供需平衡,分配制度需要重塑。如美國總統競選人楊安澤提出向大企業征收增值稅,並向公民發放補貼,以及OpenAI創始人Sam Altman提出的世界幣均等分配等,都透過反思並調整現有的分配方式,以驅動社會向更美好的方向演進。

AIGC的監管展望:寬松鼓勵與整頓規範

鼓勵AIGC研究,放寬內容容錯率,強調AI生成標識,推動公開數據建設

自AIGC逐漸套用以來,引發了知識幻覺、數據安全、個人私密、道德倫理等諸多問題和討論,新生的行業亟需監管措施的跟進和健康發展引導。2023年7月,網信辦等七個部門正式釋出了【生成式人工智慧服務管理暫行辦法】(以下簡稱【辦法】),距離征求意見稿釋出僅隔三個月,且監管要求更為寬松,反復強調了鼓勵發展的態度。具體來看,【辦法】主要規範公共服務環節,不包含有關專業機構的研發和套用環節,鼓勵企業在自研自用範圍加強技術攻關;其次,【辦法】不強求生成內容的真實、準確性,放寬了容錯率,對前期探索的企業帶來一定利好,但同時也提高了使用者辨別的時間和成本。同時,【辦法】要求提供者對AI生成內容進行顯著標識,有望從根本上杜絕AI生成內容難以辨別的問題,但也可能影響使用者對內容的價值判斷,對企業帶來負面影響。最後,國家以立法的形式打造數據和算力協同共享的平台,最大化促進資源利用,有利於為中小型企業減負,降低研發成本。【辦法】釋出後,即引發了蘋果市集對ChatGPT、訊飛星火等AIGC相關App的下架整改行動,行業整頓步伐進一步加速。


協同辦公市場研究 | 數位化新采購發展 零售數位化的轉型 | 企業的數位化轉型 車企的數位化轉型 | 資料庫的行業研究