當前位置: 華文世界 > 科技

數位人狂奔600天,還有四大檻

2024-08-26科技

要跨過場景、ROI、落地門檻、競爭壁壘四重門檻。

文|徐鑫

編|任曉漁

作為大模型落地的最熱門領域之一,數位人賽道在過去一年半時間裏快速變動,並呈現出了四大動向:

一方面,大模型技術驅動下,數位人的互動能力和使用者體驗都有了不小的提升。比如從原來的換嘴式、非即時的階段,前進演化到了能驅動全臉的表情,完成簡單的全身動作。

其次,企業套用AI數位人,目標也非常明確和務實,就是要創新業務和幫助企業降本增效。在直播帶貨、數位人客服、虛擬主播等ROI較好測算的場景,數位人產生的價值最明顯,也在率先實作落地。

三是,針對企業套用數位人普遍面臨的成本高、難落地等問題,廠商們已經采取了一系列動作,包括降價、開源以及持續的產品技術投入,來降低數位人套用和落地門檻。

而隨著行業裏大小玩家卷技術,卷價格,同時數位人套用成巨頭標配,競爭也不可避免變得激烈起來。業界也在形成共識,創業團隊要走出差異化路線,並盡快實作自我造血,才有發展空間。

01

大模型落地的最熱門場景之一

去年下半年以來,廠商們在加速探索大模型落地企業的合適場景和路徑,數位人被不少廠商列為了模型落地的先鋒場景。

今年6月,百度智慧雲在一場內部交流會上提到,3月他們把曦靈數位人作為大模型落地的7款標桿套用之一。到6月,數位人作為3個重點套用之一被再次加碼。他們提到,企業內部知識管理、客服、行銷這幾個環節,是當下大模型能幫助企業增收提效的最佳路徑。

無獨有偶,上個月京東言犀數位人升級到3.0版本,京東言犀大模型團隊在媒體交流時提及,數位人是他們探索大模型落地時最大的創新套用,並且數位人在大模型與終端互動中占據重要位置。

「數位人和智慧體、具身智慧是未來大模型與終端使用者的核心互動介質,智慧體更偏雲端,數位人更偏端側,具身智慧更偏向線下的物理世界。」該人士說。

螞蟻靈境數位人團隊相關人士則看到,數位人是大模型能力的載體之一,「大模型與數位人結合後,具有無需人工幹預的自動互動能力,再結合多模態互動能力,有助於提升人機互動體驗」。

隨著廠商積極將大模型技術與數位人結合,數位人在 互動能力和使用者體驗上也在快速升級,生產成本也大大降低。

「以前是換嘴的那種,非即時的,現在可以做到驅動全臉的表情,並且也能做一些簡單的全身動作」,中科深智CTO宋健觀察,最近半年2D數位人與大模型結合,進展非常快。

行業裏此前有一種說法,一些名人的數位人表現得動作單調,且經常重復,因為采取了類「錄播」邏輯,它只能重復「播放」與提供的視訊物料,例如提供的視訊是坐著的形態,數位人就沒有其他姿勢和形態。

宋健認為,在大模型的支撐下,數位人就會擺脫這類情況,可以生成更多的動作形態。這個過程分為兩步,首先是用來自互聯網的幾千萬、幾億量級的圖片、視訊等數據,訓練一個基礎模型。

第二步是把目標人物的素材餵給模型,生成與目標人物的ID特征、形態等各方面比較吻合的數位人。現在比較熱的多模態模型跟數位人結合,就是幹這個。透過提供的圖片、視訊和語音資料來獲取人物本身的動作特征等,生成新的內容。「目前階段,要完全實作這一點,也有兩個難點,一個是成本高,另外生成的內容有時候會有些幻覺,品質有些瑕疵」,宋健說。

大模型加持下, 數位人還在音色、韻律、表達的豐富程度上都有了比較明顯的提升。

比如在音色方面,京東言犀數位人團隊介紹,「大模型升級前,數位人的直播間說321倒計時,對於321突然的節奏、音調的變化,數位人表達得相對會比較機械,沒有那麽自然,現在整體自然很多,變得更像真人。」

大模型還使得數位人的生產成本在降低。「以前需要送出很長時間的素材,這些素材還要拿回到模型去訓練,現在 送出的素材變得非常簡單 ,比如給幾秒鐘的語音,相當於Prompt的方式,大模型可以秒級復刻, 不用拿回模型再訓練 。」一位數位人行業資深人士說。

02

算得清ROI的場景,正率先落地

正如大模型落地到其他場景一樣,企業對AI數位人的套用和落地態度也走向理性。

IDC中國研究經理程蔭告訴數智前線,當下,企業對於AI數位人的套用主要出於 創新業務和幫助企業降本增效考量 。當前數位人價值最明顯的領域在直播帶貨、數位人客服、虛擬主播等場景,ROI較好測算。

直播領域也是公眾最熟悉、最熱門的場景。業界觀察到,目前這個場景裏,平台的態度和政策有明顯差異。

6月騰訊釋出了【視訊號櫥窗達人「釋出低品質內容」實施細則】的修訂意見征集通知,修訂後的細則規定,在直播過程中存在使用非即時直播內容或道具代替真實直播的行為都被視作非真實直播,屬違規行為。雖然這是一則修訂意見征集通知,引發了行業內廣泛討論。快手之後也提出不會對AIGC輔助創作內容給予額外流量扶持。

與之形成鮮明對比的則是京東這樣的電商平台。今年4月,劉強東親自上陣支持數位人,采銷東哥AI數位人上線後引發了4000萬人圍觀,到6·18京東還大秀言犀數位人的直播成績。相比而言,京東對數位人直播顯得友好許多。

一位數位人企業高管告訴數智前線,平台的態度差異其實與平台內容及數位人當下的能力邊界有關。電商平台裏,直播最重要的角色是講解商品資訊,需要去做的肢體動作和任務相對而言比較單一。相較而言視訊號等社交內容更突出的平台裏,直播時人需要去完成的動作和任務會更為復雜和多元。

「目前數位人的技術去完成商品講解的任務基本能滿足要求,但是許多大量的娛樂化內容,需要去表演去做復雜的動作,數位人目前還不能勝任。」這位行業資深人士認為這可能是不同平台從平台調性出發,形成差異化態度的癥結。

另一家數位人公司的創始人則認為,平台公域裏流量要算利用效率和成本,品質不達標的數位人直播,流量的利用效率也低,平台就很難用公域流量去支持,因此關鍵還是看數位人內容的品質。

不少數位人廠商已經把ROI為正作為吸引更多企業使用者的賣點。比如特看科技此前告訴數智前線,目前他們兩款產品,一款從文案到表達都是AI完成的數位人,企業每投入1塊錢,能夠收回2塊錢。另一款真人驅動可以換臉的產品,相比前一類數位人多了一個客服講解的人力投入,但總歸企業投入後能賺錢。

快手在今年WAIC的一場論壇上也提到了客戶使用女媧數位人平台,已經能拿到相對確定的結果。 一般行業內真人主播的投入一年至少在55萬以上 ,還有場地和裝置以及直播的其他人力投入若幹。而 數位人相比在3~5萬一年 ,不需要專門的場地投入,裝置和營運投入相比真人主播也大幅降低,但從收益來看,數位人主播已經接近真人主播水平。

可以說,行業內對當下數位人主播的收益已經有相對理性的認知。一方面,大家用數位人對標的不是頭部的主播,而是超越行業80%水平的主播。一些數位人企業還會給市場潑冷水,稱數位人並非靈丹妙藥,那些靠真人都賣不出去的產品,用了數位人也很難大賣。

除了率先套用和落地的直播場景,廠商們也在積極探索將數位人套用到醫療、政務、金融、文旅等行業。不過IDC指出,除了ROI能方便測算的場景,數位人帶來的業務價值不好測算是其套用到更廣領域裏要面臨的挑戰之一。

03

降低成本和使用門檻是重中之重

AI數位人快速推進,廠商們也需要直面和解決新技術落地遭遇的挑戰。業界觀察到,除了如何評估真正帶來的業務價值外,AI數位人落地還普遍面臨成本、易用性和後期營運等多個層面的挑戰。

一家大模型廠商坦言此前探索數位人直播套用時踩過一些坑,這裏面就包括當下數位人技術距離真人的表現仍有很大差距,同時數位人的使用門檻和成本都不低。廠商們已經意識到問題,並著手解決。

數位人的易用性,涉及到從生產制作到配置、營運的全過程。

生產制作層面,目前行業解法是從模型著手,提升模型的魯棒性,降低對數位人生成所需素材的要求。比如只用送出一張照片,幾秒的語音素材,就能生成數位人,大量的工作透過後端的技術和演算法搞定。

這也是目前不少廠商在探索的小樣本和零樣本技術。訓練好基礎模型,新的數位人生成時不需要再拿到底層模型訓練。「只用聽這個人講幾秒鐘或幾分鐘,模型就能吐出來相應的語料語句。」一位行業人士說。

廠商們還很重視將數位人的生成制作、上線過程沈澱到平台化的產品裏。比如京東言犀數位人團隊介紹,他們現在新拍攝一個數位人的數據,從數據的處理,基於訓練效果的調優,到模型的上線,以及Demo的制作,完全都能由營運來完成。「產品化之前還需要很多演算法去調,現在完全基於數位人的平台可以完成,這提升了數位人上新的效率」。

生產完了之後,怎麽快速在生產場景配置起來也是企業關註的點。比如直播場景裏快速搭建直播間,需要數位人廠商有相應的產品和功能去支持。百度曦靈數位人相關人士介紹,他們在數位人直播場景做了多平台覆蓋,可以基於商品自動生成直播間,加速產品套用。

由於大模型技術的發展,目前百度、京東、騰訊、商湯等多家廠商都強調過數位人的制作難度和制作周期已經有了大幅縮減。

IDC還看到,未來數位人廠商的服務模式也很重要。他們聽到很多行業使用者反饋,在一些直播場景下的AI數位人廠商不具備代營運服務能力,而企業自己營運起來難度也非常大。因此,目前行業裏已經有一些廠商把代營運納入到了付費服務中。

產品和技術之外,行業裏也有人反饋一些數位人的價格問題。目前行業裏數位人的價格相差比較大,有幾千元一年的產品,也有廠商拿到千萬元級的大計畫。千萬級的計畫可能是一些地方政府做的城市數位人整套解決方案,包括了硬體,數位人產品是其中的一個元件。

也已經有廠商從價格和獲得門檻入手,加速數位人的普及和套用。今年6月,在百度智慧雲大模型產品套用釋出會上,百度智慧雲副總裁喻友平宣布, 2D數位分身和3D數位人的價格分別降至3000元和1.2萬元 ,百度稱,它們的2D數位人低於行業平均價格60%,3D數位人低於行業最低價格90%。

喻友平認為,這能讓更多的企業和使用者能夠使用上數位人,「一旦數位人的價格能夠真正有大幅的下降之後,數位人將得到普遍套用,加快在文旅宣傳、視訊制作、直播帶貨、企業導購等各種場景普及。」

還有企業透過開源開放的手段,來加速數位人技術的普及。比如矽基智慧在6月宣布開源其AI數位人互動平台,使開發者能快速建立並部署智慧數位人。

IDC認為AI數位人技術使用的平民化正成為市場關註的重點。如何透過相關技術降低產品的使用和成本門檻將成為未來競爭的關鍵因素之一。

04

巨頭炮火下,創業公司的機會在哪裏

去年到今年,一家布局過數位人業務的企業正在降低數位人板塊的權重。這與該企業創始人對數位人市場格局的判斷有關。

「之前我認為競爭對手是一些A、B輪的公司,隨著大廠紛紛投入,比如字節大力投入剪映,視訊類自動化生產工具未來 大機率處於大廠射程之內」,這位創始人因此將數位人板塊的業務權重降低,仍然保留技術投入,但是縮減規模

中科深智宋健也認為,市場當下的確在發生一些變化。數位人套用已經從一開始令人有些獵奇的存在,慢慢變成一個基礎的元件, 大廠和平台級公司進場將數位人作為大的服務包裏的一個模組

IDC分析市場頭部供應商格局時告訴數智前線,目前明星AI創業公司因較早進入市場,在數位人板塊,產品矩陣較為完備,市場認知度高,展現了較強的商業化能力;而以雲服務為代表的平台級公司,優勢在有一定的品牌知名度和使用者基數,且借助合作夥伴和渠道力量,可以快速推廣產品。「以此來看,未來的競爭肯定是更加激烈」,IDC程蔭說。

「平台企業在市場拓展或滲透階段,不會把成本作為最重要的考量因素,因此對賽道裏的創業團隊而言,如果不能獲得營收,不具備商業永續性,可能就沒法往下走。」宋健告訴數智前線。

不過這並不意味著大平台之外的玩家沒有發展空間。

大廠走的是通用路線,做的是標準化的東西,但其實每個行業都有復雜的需求 」,宋健說,比如,用數位人做服裝模特,聽起來很簡單,但大平台的產品很少滲透到這個細分市場。因為需要針對數位模特再去客製一套系統,從模特的選型到衣服試穿,還需要專門去展示服裝的動作,這些可能是用於短視訊或者直播平台。但這些需求並非標準化的數位人模組就能完成。

創業團隊如何基於非標準化的產品形成商業閉環,因而成了AI數位人賽道,創業團隊與大廠差異化競爭的關鍵。

數智前線獲悉,目前中科深智就在探索,利用數位人做短視訊來完成客戶的互動行銷需求。這裏面數位人和內容只是其中的一環。比如一些企業的線下店,透過線上的數位人視訊投放引流。給客戶提供的服務,既包括要針對店鋪去生成合適的數位人帶貨視訊,還包括把視訊投放到不同的區域,獲得本地流量。基於視訊和流量,形成了數據和商業營運的閉環,並且不斷去改進視訊內容的組合方式,最終靠CPS(按實際銷售額來計費的廣告,可以理解為銷售額提成)的流量來付費。

「只提供一個工具,就是與大廠正面PK,但如果是帶有CPS服務的非標產品,雙方就不在一個維度競爭」,宋健說。

這種態勢下,玩家之間的競合關系也在變得更為多元。數智前線了解到,在標準產品滿足不了客戶場景需求的場合,大平台也會帶著中小數位人團隊共同服務客戶。比如特看科技的樂乘就介紹,他們目前也在與大廠合作,整合到大廠的產品模組裏共同去服務一些醫藥行業的市場,「靠我們自己拿不下這樣的客戶,透過API的方式整合到大廠的產品裏,各方是多贏關系」。

市場已經卷起來了,不過當下AI數位人依然處於起步階段,IDC判斷,到2026年中國AI數位人市場規模將達到102.4億元人民幣,距離市場成熟還需要時間。而無論是創業公司還是平台級企業,未來在這個市場都需要努力建立技術壁壘,以抓住機會。