當前位置: 華文世界 > 科技

數碼人狂奔600天,還有四大檻

2024-08-26科技

要跨過場景、ROI、落地門檻、競爭壁壘四重門檻。

文|徐鑫

編|任曉漁

作為大模型落地的最熱門領域之一,數碼人賽道在過去一年半時間裏快速變動,並呈現出了四大動向:

一方面,大模型技術驅動下,數碼人的互動能力和使用者體驗都有了不小的提升。比如從原來的換嘴式、非即時的階段,前進演化到了能驅動全臉的表情,完成簡單的全身動作。

其次,企業套用AI數碼人,目標也非常明確和務實,就是要創新業務和幫助企業降本增效。在直播帶貨、數碼人客服、虛擬主播等ROI較好測算的場景,數碼人產生的價值最明顯,也在率先實作落地。

三是,針對企業套用數碼人普遍面臨的成本高、難落地等問題,廠商們已經采取了一系列動作,包括降價、開源以及持續的產品技術投入,來降低數碼人套用和落地門檻。

而隨著行業裏大小玩家卷技術,卷價格,同時數碼人套用成巨頭標配,競爭也不可避免變得激烈起來。業界也在形成共識,創業團隊要走出差異化路線,並盡快實作自我造血,才有發展空間。

01

大模型落地的最熱門場景之一

去年下半年以來,廠商們在加速探索大模型落地企業的合適場景和路徑,數碼人被不少廠商列為了模型落地的先鋒場景。

今年6月,百度智能雲在一場內部交流會上提到,3月他們把曦靈數碼人作為大模型落地的7款標桿套用之一。到6月,數碼人作為3個重點套用之一被再次加碼。他們提到,企業內部知識管理、客服、行銷這幾個環節,是當下大模型能幫助企業增收提效的最佳路徑。

無獨有偶,上個月京東言犀數碼人升級到3.0版本,京東言犀大模型團隊在媒體交流時提及,數碼人是他們探索大模型落地時最大的創新套用,並且數碼人在大模型與終端互動中占據重要位置。

「數碼人和智能體、具身智能是未來大模型與終端使用者的核心互動介質,智能體更偏雲端,數碼人更偏端側,具身智能更偏向線下的物理世界。」該人士說。

螞蟻靈境數碼人團隊相關人士則看到,數碼人是大模型能力的載體之一,「大模型與數碼人結合後,具有無需人工幹預的自動互動能力,再結合多模態互動能力,有助於提升人機互動體驗」。

隨著廠商積極將大模型技術與數碼人結合,數碼人在 互動能力和使用者體驗上也在快速升級,生產成本也大大降低。

「以前是換嘴的那種,非即時的,現在可以做到驅動全臉的表情,並且也能做一些簡單的全身動作」,中科深智CTO宋健觀察,最近半年2D數碼人與大模型結合,進展非常快。

行業裏此前有一種說法,一些名人的數碼人表現得動作單調,且經常重復,因為采取了類「錄播」邏輯,它只能重復「播放」與提供的影片物料,例如提供的影片是坐著的形態,數碼人就沒有其他姿勢和形態。

宋健認為,在大模型的支撐下,數碼人就會擺脫這類情況,可以生成更多的動作形態。這個過程分為兩步,首先是用來自互聯網的幾千萬、幾億量級的圖片、影片等數據,訓練一個基礎模型。

第二步是把目標人物的素材餵給模型,生成與目標人物的ID特征、形態等各方面比較吻合的數碼人。現在比較熱的多模態模型跟數碼人結合,就是幹這個。透過提供的圖片、影片和語音資料來獲取人物本身的動作特征等,生成新的內容。「目前階段,要完全實作這一點,也有兩個難點,一個是成本高,另外生成的內容有時候會有些幻覺,質素有些瑕疵」,宋健說。

大模型加持下, 數碼人還在音色、韻律、表達的豐富程度上都有了比較明顯的提升。

比如在音色方面,京東言犀數碼人團隊介紹,「大模型升級前,數碼人的直播間說321倒計時,對於321突然的節奏、音調的變化,數碼人表達得相對會比較機械,沒有那麽自然,現在整體自然很多,變得更像真人。」

大模型還使得數碼人的生產成本在降低。「以前需要送出很長時間的素材,這些素材還要拿回到模型去訓練,現在 送出的素材變得非常簡單 ,比如給幾秒鐘的語音,相當於Prompt的方式,大模型可以秒級復刻, 不用拿回模型再訓練 。」一位數碼人行業資深人士說。

02

算得清ROI的場景,正率先落地

正如大模型落地到其他場景一樣,企業對AI數碼人的套用和落地態度也走向理性。

IDC中國研究經理程蔭告訴數智前線,當下,企業對於AI數碼人的套用主要出於 創新業務和幫助企業降本增效考量 。當前數碼人價值最明顯的領域在直播帶貨、數碼人客服、虛擬主播等場景,ROI較好測算。

直播領域也是公眾最熟悉、最熱門的場景。業界觀察到,目前這個場景裏,平台的態度和政策有明顯差異。

6月騰訊釋出了【影片號櫥窗達人「釋出低質素內容」實施細則】的修訂意見征集通知,修訂後的細則規定,在直播過程中存在使用非即時直播內容或道具代替真實直播的行為都被視作非真實直播,屬違規行為。雖然這是一則修訂意見征集通知,引發了行業內廣泛討論。快手之後也提出不會對AIGC輔助創作內容給予額外流量扶持。

與之形成鮮明對比的則是京東這樣的電商平台。今年4月,劉強東親自上陣支持數碼人,采銷東哥AI數碼人上線後引發了4000萬人圍觀,到6·18京東還大秀言犀數碼人的直播成績。相比而言,京東對數碼人直播顯得友好許多。

一位數碼人企業高管告訴數智前線,平台的態度差異其實與平台內容及數碼人當下的能力邊界有關。電商平台裏,直播最重要的角色是講解商品資訊,需要去做的肢體動作和任務相對而言比較單一。相較而言影片號等社交內容更突出的平台裏,直播時人需要去完成的動作和任務會更為復雜和多元。

「目前數碼人的技術去完成商品講解的任務基本能滿足要求,但是許多大量的娛樂化內容,需要去表演去做復雜的動作,數碼人目前還不能勝任。」這位行業資深人士認為這可能是不同平台從平台調性出發,形成差異化態度的癥結。

另一家數碼人公司的創始人則認為,平台公域裏流量要算利用效率和成本,質素不達標的數碼人直播,流量的利用效率也低,平台就很難用公域流量去支持,因此關鍵還是看數碼人內容的質素。

不少數碼人廠商已經把ROI為正作為吸引更多企業使用者的賣點。比如特看科技此前告訴數智前線,目前他們兩款產品,一款從文案到表達都是AI完成的數碼人,企業每投入1塊錢,能夠收回2塊錢。另一款真人驅動可以換臉的產品,相比前一類數碼人多了一個客服講解的人力投入,但總歸企業投入後能賺錢。

快手在今年WAIC的一場論壇上也提到了客戶使用女媧數碼人平台,已經能拿到相對確定的結果。 一般行業內真人主播的投入一年至少在55萬以上 ,還有場地和器材以及直播的其他人力投入若幹。而 數碼人相比在3~5萬一年 ,不需要專門的場地投入,器材和營運投入相比真人主播也大幅降低,但從收益來看,數碼人主播已經接近真人主播水平。

可以說,行業內對當下數碼人主播的收益已經有相對理性的認知。一方面,大家用數碼人對標的不是頭部的主播,而是超越行業80%水平的主播。一些數碼人企業還會給市場潑冷水,稱數碼人並非靈丹妙藥,那些靠真人都賣不出去的產品,用了數碼人也很難大賣。

除了率先套用和落地的直播場景,廠商們也在積極探索將數碼人套用到醫療、政務、金融、文旅等行業。不過IDC指出,除了ROI能方便測算的場景,數碼人帶來的業務價值不好測算是其套用到更廣領域裏要面臨的挑戰之一。

03

降低成本和使用門檻是重中之重

AI數碼人快速推進,廠商們也需要直面和解決新技術落地遭遇的挑戰。業界觀察到,除了如何評估真正帶來的業務價值外,AI數碼人落地還普遍面臨成本、易用性和後期營運等多個層面的挑戰。

一家大模型廠商坦言此前探索數碼人直播套用時踩過一些坑,這裏面就包括當下數碼人技術距離真人的表現仍有很大差距,同時數碼人的使用門檻和成本都不低。廠商們已經意識到問題,並著手解決。

數碼人的易用性,涉及到從生產制作到配置、營運的全過程。

生產制作層面,目前行業解法是從模型著手,提升模型的魯棒性,降低對數碼人生成所需素材的要求。比如只用送出一張照片,幾秒的語音素材,就能生成數碼人,大量的工作透過後端的技術和演算法搞定。

這也是目前不少廠商在探索的小樣本和零樣本技術。訓練好基礎模型,新的數碼人生成時不需要再拿到底層模型訓練。「只用聽這個人講幾秒鐘或幾分鐘,模型就能吐出來相應的語料語句。」一位行業人士說。

廠商們還很重視將數碼人的生成制作、上線過程沈澱到平台化的產品裏。比如京東言犀數碼人團隊介紹,他們現在新拍攝一個數碼人的數據,從數據的處理,基於訓練效果的調優,到模型的上線,以及Demo的制作,完全都能由營運來完成。「產品化之前還需要很多演算法去調,現在完全基於數碼人的平台可以完成,這提升了數碼人上新的效率」。

生產完了之後,怎麽快速在生產場景配置起來也是企業關註的點。比如直播場景裏快速搭建直播間,需要數碼人廠商有相應的產品和功能去支持。百度曦靈數碼人相關人士介紹,他們在數碼人直播場景做了多平台覆蓋,可以基於商品自動生成直播間,加速產品套用。

由於大模型技術的發展,目前百度、京東、騰訊、商湯等多家廠商都強調過數碼人的制作難度和制作周期已經有了大幅縮減。

IDC還看到,未來數碼人廠商的服務模式也很重要。他們聽到很多行業使用者反饋,在一些直播場景下的AI數碼人廠商不具備代營運服務能力,而企業自己營運起來難度也非常大。因此,目前行業裏已經有一些廠商把代營運納入到了付費服務中。

產品和技術之外,行業裏也有人反饋一些數碼人的價格問題。目前行業裏數碼人的價格相差比較大,有幾千元一年的產品,也有廠商拿到千萬元級的大專案。千萬級的專案可能是一些地方政府做的城市數碼人整套解決方案,包括了硬件,數碼人產品是其中的一個元件。

也已經有廠商從價格和獲得門檻入手,加速數碼人的普及和套用。今年6月,在百度智能雲大模型產品套用釋出會上,百度智能雲副總裁喻友平宣布, 2D數碼分身和3D數碼人的價格分別降至3000元和1.2萬元 ,百度稱,它們的2D數碼人低於行業平均價格60%,3D數碼人低於行業最低價格90%。

喻友平認為,這能讓更多的企業和使用者能夠使用上數碼人,「一旦數碼人的價格能夠真正有大幅的下降之後,數碼人將得到普遍套用,加快在文旅宣傳、影片制作、直播帶貨、企業導購等各種場景普及。」

還有企業透過開源開放的手段,來加速數碼人技術的普及。比如矽基智能在6月宣布開源其AI數碼人互動平台,使開發者能快速建立並部署智能數碼人。

IDC認為AI數碼人技術使用的平民化正成為市場關註的重點。如何透過相關技術降低產品的使用和成本門檻將成為未來競爭的關鍵因素之一。

04

巨頭炮火下,創業公司的機會在哪裏

去年到今年,一家布局過數碼人業務的企業正在降低數碼人板塊的權重。這與該企業創始人對數碼人市場格局的判斷有關。

「之前我認為競爭對手是一些A、B輪的公司,隨著大廠紛紛投入,比如字節大力投入剪映,影片類自動化生產工具未來 大概率處於大廠射程之內」,這位創始人因此將數碼人板塊的業務權重降低,仍然保留技術投入,但是縮減規模

中科深智宋健也認為,市場當下的確在發生一些變化。數碼人套用已經從一開始令人有些獵奇的存在,慢慢變成一個基礎的元件, 大廠和平台級公司進場將數碼人作為大的服務包裏的一個模組

IDC分析市場頭部供應商格局時告訴數智前線,目前明星AI創業公司因較早進入市場,在數碼人板塊,產品矩陣較為完備,市場認知度高,展現了較強的商業化能力;而以雲服務為代表的平台級公司,優勢在有一定的品牌知名度和使用者基數,且借助合作夥伴和渠道力量,可以快速推廣產品。「以此來看,未來的競爭肯定是更加激烈」,IDC程蔭說。

「平台企業在市場拓展或滲透階段,不會把成本作為最重要的考量因素,因此對賽道裏的創業團隊而言,如果不能獲得營收,不具備商業可持續性,可能就沒法往下走。」宋健告訴數智前線。

不過這並不意味著大平台之外的玩家沒有發展空間。

大廠走的是通用路線,做的是標準化的東西,但其實每個行業都有復雜的需求 」,宋健說,比如,用數碼人做服裝模特,聽起來很簡單,但大平台的產品很少滲透到這個細分市場。因為需要針對數碼模特再去客製一套系統,從模特的選型到衣服試穿,還需要專門去展示服裝的動作,這些可能是用於短影片或者直播平台。但這些需求並非標準化的數碼人模組就能完成。

創業團隊如何基於非標準化的產品形成商業閉環,因而成了AI數碼人賽道,創業團隊與大廠差異化競爭的關鍵。

數智前線獲悉,目前中科深智就在探索,利用數碼人做短影片來完成客戶的互動行銷需求。這裏面數碼人和內容只是其中的一環。比如一些企業的線下店,透過線上的數碼人影片投放引流。給客戶提供的服務,既包括要針對店鋪去生成合適的數碼人帶貨影片,還包括把影片投放到不同的區域,獲得本地流量。基於影片和流量,形成了數據和商業營運的閉環,並且不斷去改進影片內容的組合方式,最終靠CPS(按實際銷售額來計費的廣告,可以理解為銷售額提成)的流量來付費。

「只提供一個工具,就是與大廠正面PK,但如果是帶有CPS服務的非標產品,雙方就不在一個維度競爭」,宋健說。

這種態勢下,玩家之間的競合關系也在變得更為多元。數智前線了解到,在標準產品滿足不了客戶場景需求的場合,大平台也會帶著中小數碼人團隊共同服務客戶。比如特看科技的樂乘就介紹,他們目前也在與大廠合作,整合到大廠的產品模組裏共同去服務一些醫藥行業的市場,「靠我們自己拿不下這樣的客戶,透過API的方式整合到大廠的產品裏,各方是多贏關系」。

市場已經卷起來了,不過當下AI數碼人依然處於起步階段,IDC判斷,到2026年中國AI數碼人市場規模將達到102.4億元人民幣,距離市場成熟還需要時間。而無論是創業公司還是平台級企業,未來在這個市場都需要努力建立技術壁壘,以抓住機會。