當前位置: 華文世界 > 科技

數碼人五人談:為什麽需要另一個我

2024-02-10科技

數碼人產業方興未艾,正快速走進我們的數碼化生活、數碼化營運和數碼化治理的海量數碼化轉型場景。從元宇宙的爆發到AIGC的出圈,數碼人的市場「生命力」日益旺盛,由概念化進入實質性發展和落地階段,在各領域形成規模化套用。

據悉,近兩年,中國聯通率先布局數碼人技術研發與商業套用,去年正式推出了個人數碼人、全真數碼人、專業級虛擬數碼人等數碼人產品矩陣和全棧數碼人技術。

近日,五位通訊產業專家、學者走進中國聯通數碼人制作中心,體驗全真數碼人的制作過程,成為通訊首批集體亮相數碼人。

全真數碼人初體驗

全真數碼人又稱為2D數碼人,透過對真人的表情、嘴型、肢體動作、聲音采集復刻,透過AI技術實作形象聲音驅動和多模態互動演算法模型訓練,實作2D數碼人智能生成和感知互動。

當天,全真數碼人采集流程分兩步進行,五位專家先在綠幕前配合影片拍攝以采集形象,接著配合錄音采集音色。

「初次接觸數碼人拍攝確實有新奇甚至些許陌生感」,北京郵電大學教授呂廷傑向【通訊產業報】全媒體記者表示,隨著錄制過程的進行,驚嘆於科技帶來的變革,並對未來生活的可能性產生更多期待。

「這是我第一次親身接觸數碼人的生成過程。」【通訊產業報】全媒體總編輯辛鵬駿表示,當你由一個物理人演變成一個數碼人,需要電腦采集你足夠多的資訊,包括動作、表情、聲音、嘴型、眼神等。這一切就好像是電腦認識你的過程。「當然,這還只是第一步。」

透過對人物拍攝影片和錄制語音,中國聯通基於神經網絡的文本到語音(TTS)合成系統,將梅爾頻譜圖轉換成時域波形樣本,實作語音復刻;基於對抗神經網絡(GAN),融合較先進的光流估算方法對采集的形象進行訓練,增強五官細節、聲音與嘴型同步,實作形象復刻。最後透過Visual Token提取器、多模態動作表征對文本、圖片、影片進行數據提取,透過多模態互動模型合生影片。

GSMA大中華區戰略合作總經理龐策表示,數碼人套用範圍不斷拓寬,賦能各套用領域。在以個性表達為主的虛擬人方面主要有兩個發展方向。一是由虛向實,建立原創虛擬形象套用於物理世界。例如以虛擬主播、品牌代言人、潮流體驗官等身份,拍攝廣告、雲打卡展覽、釋出品牌宣傳等活動。二是由實向虛,依據物理世界實際存在的個人,構建數碼孿生虛擬人。這次受聯通邀請參與數碼人制作就屬於數碼孿生虛擬人,整個錄制過程40分鐘左右,包括影片、動作、聲音采集等。真人數碼孿生的套用場景已經越來越豐富,同時和人工智能技術結合,更能發揮出較大的商業價值。

敲開元宇宙大門

隨著數碼人理論和技術日益成熟,營運商不斷探索數碼人技術的套用範圍與場景。2023年7月聯通線上率先釋出「聯通全真數碼人產品矩陣」,包括個人數碼人、全真數碼人主播、全真數碼人直播、全真數碼人客服、專業客製數碼人,面向新聞、綜藝、體育、財經、氣象等電視節目研究虛擬形象合成技術,高效助力企業完成數碼人模型播報內容,為企業打造專屬的IP形象,構築數碼人產業鏈發展新格局。

5G中國創新百人會秘書長、中國互聯網協會套用創新委員會副主任張澤軒表示,隨著傳統通訊業務的增長放緩,數碼人產業作為一種新興的業務模式,為營運商提供了新的收入來源和增長點。數碼人可以套用於客服、娛樂、教育、健康等多個領域,為營運商帶來新的商業機會。營運商發展數碼人產業不僅能夠為其帶來商業上的益處,還能夠推動技術進步、提升服務質素、促進社會發展,並在全球範圍內提升競爭力。

「如何建設和營運人人可進入、人人能使用和人人有獲得感的創新性服務是目前元宇宙亟需突破的產業難題。中國聯通無疑在這一方面是具有開拓性的。」中國通訊企業協會人工智能專委會副秘書長,工體元宇宙GTVerse創始人、首席架構師葛頎表示,數碼人承擔了個人消費者在元宇宙數碼身份認證管理、數碼社交憑證和數碼資產平台等多重內容,是企業和政府客戶在元宇宙提供2C服務、打造數碼資產和提升數碼收益的重要抓手,獲得了產業界、資本方和使用者的高度關註,從全球範圍看,叠代速度最快、微創新最多,更是使用頻次最高的雲宇宙套用。「數碼人將率先幫助廣大的個人消費者和企業、政府使用者敲開元宇宙的大門。」

「此前,營運商已推出的數碼人已套用於體育、文娛以及領導演講,此次為通訊行業推出首批數碼人非常值得稱贊。」呂廷傑表示,數碼人不僅可以用於娛樂、遊戲、影視行業,還可以作為線上課程、虛擬主播、發言致辭等多種套用場景,為我們提供全新的互動方式和服務體驗。非常期待聯通數碼人未來廣泛的套用。

做數碼人的主場孵化器

通常數碼人對算力、智力、運力、渲染、時延和藝術成長性等核心功能的要求高。完全私有化的網絡平台,成本高、安全性差且無法支持通用性智能終端。而中國聯通數碼人產品中的聯通數碼人小程式,僅需要上傳或者錄制一段2-3分鐘的本人影片,采集口播動作和皮膚狀態,即可後台生成專屬數碼分身,還原真人真貌。

葛頎表示,透過拍影片、錄語音等低數碼技能門檻的方式塑造數碼人UI/UX,雲端大模型和標準化介面深度對接營運商的5G算網和AI能力,將個人數碼資產與數碼身份管理、即時渲染調優以及DoF等有關個人私密和地理位置等私密數據由智能電話等多形態智能終端來承載,中國聯通打造的新型全像數碼人方案具有便於消費者體驗和易於實作商業閉環的系統級優勢能力,能夠支持幾乎所有的智能電話使用者使用自己的終端體驗數碼人等元宇宙新業務、新服務和新體驗。

辛鵬駿認為,中國聯通是最早推進數碼人、元宇宙的營運商,是推進數碼人的先鋒和領導者。聯通線上很早就在元宇宙、數碼人領域探索、實踐,已經積累了豐富的套用。特別是聯通在海量彩鈴、影片、5G新通話等基礎上的新業務衍生、AI影片處理、算力模型搭建、算力匹配排程等方面,都積累了豐富的經驗。「擁抱開放」是聯通的最大優勢。所有新業務、新技術、新套用的生成路徑,核心就是開放。

據悉,為了更廣泛的推廣數碼人技術,增強人們對於數碼人的體驗,中國聯通將於2024年3月在中國聯通10省營業廳落地100個「數碼人‘綠屏間’體驗廳」。使用者前往數碼人「綠屏間」,保持站定/坐著姿態,按照題詞內容錄制2-3分鐘讀稿影片,就可以等待生成數碼人形象。進一步加深使用者對數碼人的認知與體驗。2024年,中國聯通將助力實作1億人擁有自己數碼人。

龐策表示,目前,全球領先的電訊供應商都在多個非傳統電信業務領域進行創新、探索和實踐,例如雲業務、AIGC業務,元宇宙業務等。電訊供應商擁有豐富的算力基礎設施資源,專業化的技術團隊以及廣泛的C端,B端客戶資源。對於數碼人業務,非常值得營運商進行探索和嘗試。 (崔亮亮)