當前位置: 華文世界 > 科技

00後創業胡雅婷:相比連續創業者,年輕人的優勢是做「新模態」

2024-08-29科技

作者:馬蕊蕾

編輯:陳彩嫻

全國資訊學奧林匹克競賽冬令營金牌,簽約北京大學電腦系,24歲的胡雅婷,和她的清北團隊即將上線4D模型,建造屬於他們的4D世界。

「不能和成熟的創業者競爭偏傳統或較成熟的AI領域,你肯定卷不過他們。」AVAR AI公司創始人胡雅婷說道。在她看來,年輕的創業者得做下一個模態的技術,挖掘新生代使用者的需求和場景,這是00後的優勢。

相比大多數AI賽道的00後創業者,胡雅婷略顯「成熟」。2021年,她就創立了AVAR AI公司,堅定入局了3D套用場景,成為頭部的元宇宙數位品牌,和多家動畫、品牌、大廠合作。

胡雅婷很喜歡皮克斯,這家傳奇的動畫公司,是她創業路上的標桿。當AI科技評論問她:「決定創業的那一天,是怎樣的一天?」她說不上來,好像和往常沒什麽區別。

當然,皮克斯的故事並不是從創立那天開始的,AI創業公司的故事也很少是這樣的。對於胡雅婷來說,最初的火花只是畫畫、一本書和一個校園的機房。

從資訊學競賽、北大電腦系再到頭部大廠的實習,一步步踏進資訊學這個龐大的「帝國」。在Google、阿裏等大廠的實習經歷,讓她逐漸發現整個互聯網的流量已經到頂了,只能做一些微小的最佳化,從此埋下了創業的種子。

相比成熟的連續創業者,她和團隊找到了自己的優勢。3D和4D領域的競爭格局在國內外都還沒有形成,每天都有新技術出現。她坦言,即使在大廠有再多的AI經歷的創業者,大家也都是從全新的起點去探索。

今年5月AVAR AI公司推出了Unique3D演算法及新產品Aiuni AI,只需上傳一張圖片,就能在30秒內生成高精細度和還原度的3D模型,Unique3D上線後就登上了 Huggingface的熱門模型排行榜。

胡雅婷透露,公司即將會釋出4D模型,他們選擇的技術路線是使用平面圖生成 3D模型,再將3D模型變成4D動畫模型。

目前,Aiuni AI的使用者主要為專業化使用者和平台愛好者。接下來他們會更聚焦在動畫領域,關註創作者的生態。她發現,在各類AI賽道的生態當中,國內使用者的創造性和供應能力都更略勝一籌。

構建平台的核心壁壘,她認為不完全是靠某一個技術或者功能點,核心是要形成創作者的生態,透過訂閱者和IP授權,從而形成創作者的經濟。

Aiuni AI產品留下了非常多的想象空間,將顛覆更多現有的內容模態。胡雅婷希望自己所創作的產品是一個高於自我的存在,去掉標簽、不被定義,是她想做的事情。

以下是AI科技評論與胡雅婷的訪談實錄,作者進行了不改原意的編輯整理:

從一間機房發現演算法的魅力

AI科技評論:你之前得過全國資訊學奧林匹克競賽金牌。這段經歷能展開講講嗎?

胡雅婷:我從高中才開始學競賽,身邊很多人從小學就開始了。最早沒想學,很多人參加競賽可能是因為從小數理化就很好。當時想學是因為我喜歡畫畫,初心是想體驗一下,如果學競賽就可以經常去機房用數位設計的軟體,但沒想到從中找到了演算法的樂趣。

當時看了一本書【演算法藝術】,我發現原來演算法也是一個很有創造性的過程,可以用一些巧妙的方法讓一個復雜的問題變得簡單。我當時挺叛逆的,經常會向學校教練反映,應該更改出題思路和學習計劃。

AI科技評論:這個競賽的難點是什麽?最終考核的標準是什麽?

胡雅婷:主要集中在演算法,但這個演算法和AI演算法會有區別。它是指經典的演算法數據結構,會給出一個具體的問題,但這個問題會有很多種不同的解法。比如運用暴力的方法,逐個去搜尋,速度會非常慢,但結果一定是正確的。

使用不同的方法,能解決演算法的範圍也是不同的,所以相應得到的分數也會不同。它不像常規的高考題,沒有標準的答案,你可能也可以想到出題人從來都沒有想到的方法去解決問題。

全國資訊學奧林匹克競賽,一般從省份比拼到全國大致就100人。最終每位參賽者都會拿到相同的三道題目,透過考察解法,來評定最終能拿到多少分數。

這個競賽除了決賽,還有省選、冬令營和夏令營等等。在這個過程中,你都可以和高校簽約,就可以不走傳統的高考路徑進入高校,由於湖南和浙江是競賽的強省,所以我在省選就和北京大學電腦系簽約了,2017年進入的北大。

AI科技評論:在Google、阿裏、字節做演算法工程師的實習經歷,對你創業有影響嗎?

胡雅婷:我當時覺得電腦行業,還是得多去產業界看看。一方面,想了解程式設計師和工程師具體如何參與到產品的流程中;另一方面,想理解互聯網的實際業務。這幾段經歷,正好對應了互聯網的搜尋推薦和廣告。

當時我們在最佳化推薦系統和廣告系統,流量基數一般是千億級的,所以最佳化千分之一也會很有成效。但對我來說,它不是一個從0-1搭建的新系統,我發現當時整個互聯網的流量已經到頂了,只能做一些微小的最佳化,所以我開始有點想創業。

數位人合成,圖片來源:受訪者提供

AI科技評論:你在北大電腦系這幾年有哪些關鍵的人生經歷?

胡雅婷:有兩段經歷蠻重要的。學校有一個「人工智慧創新中心」,註重 AI 和產業鏈路的結合。雖然當時還沒有AIGC,但是做AI動畫的計畫中,大家就運用判別式AI 的方式直接加入三維引擎的指令,偏生成式的把動畫制作出來。

另外,在「前沿計算中心」,有一段研究數位經濟學的經歷,當時做的比較好的是演算法賽局論。在我離開北大後,其實數位經濟學這一塊,也依然會有很多套用。

現在,我們定期會和創投相關的北大同學交流,運用偏經濟學的方法解釋我們在創業中遇到的實際問題。

AI科技評論:北大電腦系創業的同學多嗎?

胡雅婷:我們一個系有三四百人,很少有人選擇創業,一屆可能就一個。每個人的定位都不太一樣,我們當中大部份同學可能想繼續做研究,但我確實還是想解決一些真實的問題。

不太想只做技術,我更想做一些技術結合藝術或產品市場的方向。

AI科技評論:是什麽促使你最終邁出了創業這一步?

胡雅婷:學校的創業氛圍其實不太濃厚,但在2020年的疫情,導致很多留學生回國,突然發現所有留學生好像都在做一些創業嘗試。

大家一起展開了挺多創業相關的活動,相當於真正開始了解創業。我就開始接觸到一些投資人等等,他們對於年輕人創業是比較支持的。

「CGI流程全面AI化,最起碼得3-5年」

AI科技評論:公司一開始的業務線是元宇宙,目前主要做哪些?

胡雅婷:當時說元宇宙,我們自己的定義是3D互聯網,整個 3D 內容的全流程都做,包括3D數位人、角色動畫以及偏AR的數位資產的玩法等。

現在做Aiuni AI產品,是從3D模型、動畫甚至特效,也就是CGI和VFX的流程可以用 AIGC全部自動化,並且重塑工作流。2023年年底,一系列實驗結果發現,AI生成3D是可以做到商用級的,所以就開始重點做Aiuni AI產品。

AI科技評論:之前看到一個統計,在國內做3D領域的很少,為什麽海外在這個領域就很多?

胡雅婷:我感覺3D領域華人可能做得更多,但大家都是做全球化的市場。3D領域的競爭格局還沒有形成,就比如Midjourney和OpenAI已經跑出來了,你不可能再定義去做海外。但3D領域其實美國公司也還沒有跑出來,所以中國公司定位會是全球。

3D生成到3D打印,圖片來源:受訪者提供

AI科技評論:從什麽時候開始就堅定要布局3D套用場景?

胡雅婷:我自己還是很相信內容升維這件事,平面上的內容,無論是圖片還是視訊,能做的都已經被人做了。但我覺得3D是一個全新的內容模態,可以隨時提出新的演算法和架構,有很多全新的問題待解決,可以做的空間還很大。

我確實非常喜歡整個CG的內容,包括整個三維的發展,它確實是一個可以和藝術相結合的領域。

AI科技評論:目前團隊情況,怎麽組建起來的?主要成員的分工是怎樣的?

胡雅婷:公司CTO因為全國資訊學奧林匹克競賽而認識,他在清華姚班,目前在公司主要做AI+3D演算法相關的工作;COO是北大的學姐,她是北大藝術史論與工商管理雙學位,目前負責營運和創作者相關的工作;還有兩位成員,一位是演算法研究員,一位是CG Artist。

Aiuni AI 及Unique3D的清北團隊,圖片來源:受訪者提供

AI科技評論:Aiuni AI產品的定位以及一開始直接開源模型Unique3D,是基於什麽考慮?

胡雅婷:Aiuni AI產品主要就是用AI生成三維動畫,目前已經上線了3D模型生成以及全景生成,接下來會做3D 生成空間模型、動畫生成、角色生成、渲染合成等。

我們認為3D還是一個開源開放的技術,讓更多的人參與其中,用技術換取一些影響力。同時,產品商業化方面,我們不準備以單一的API方式去做商業化,想做全流程的事情,比如角色動畫或者合成一個直接能拿去商用的視訊,我們更關註這些。

AI科技評論:你們生成的三維產品精度和還原性非常高,怎麽做到的?

胡雅婷:我們運用了比較創新的生產架構,相當於對3D Mesh進行了像素級的最佳化,所以你的圖片有多精致,相應生成的模型精度就會有多高。在多視角渲染圖方面,我們實作了超分辨率。

其他演算法如果走三維放射線場的話,一般的分辨率最高就是256或者512,如果達到512的分辨率就會消耗很多視訊記憶體。但我們有一個直接最佳化Mesh的演算法,它的復雜度不與模型體積相關,而是與表面積相關。我們現在的版本最佳化到了2K級,如果後續我們想要最佳化到8K級,三維生成也是可以在幾分鐘內就可以實作。

AI科技評論:Aiuni AI目前的功能以及數據表現如何?

胡雅婷:目前的功能是三維生成和全景生成,接下來重點上線的功能主要是角色生成和角色動畫的生成。現在3D模型有百萬級的生成量,大家反復生成的數據還是比較高的,反復使用的使用者有70%,海外使用者也有60%。

AI科技評論:面向的使用者群體是?

胡雅婷:主要還是數位內容的創作者。他們分兩類,一類是專業化的使用者,主要是3D的設計師和動畫師等;一類是IP創作者,用AI工具創作喜歡的形象,再進一步生成模型和動畫。

這兩類人群各占一半,接下來我們聚焦在動畫方面,就會更關註偏創作者的這些群體。

AI科技評論:你覺得目前Aiuni AI產品,抓住了使用者的哪些需求?

胡雅婷:我們的產品相當於數位內容的生產力,作為內容創作者,他們希望產出很好的新媒體內容,分享釋出形成自己的IP。做新媒體,動畫視訊肯定比做圖文會好,但是之前的3D模型和動畫的制作非常繁瑣。

一般做 3D 模型建模就需要一周,如果需要繫結動畫渲染,基本上就得一個月,找人去做是一個非常高的成本。但現在運用AI工具,30秒就可以生成模型,創作者改一改,一個小時就可以制作動畫,這完全是一個新的生產方式。

我們和這些創作者交流的時候,大家會覺得創作是不分模態的,比如他們只想做一個好的IP角色,他們之前只能做圖文,如果大家都想做更加立體和動態的內容來生成動畫,他們一定會去生成動畫。

AI科技評論:目前怎麽構建平台的核心壁壘?

胡雅婷:我們覺得平台的核心壁壘,它不會完全是某一個技術或者功能點,核心是要形成這些創作者的生態,生出來的內容確實是能形成內容矩陣,具備IP影響力。

我們大部份的使用者在制作了動畫後都會釋出到新媒體,我們透過建立社群來第一時間聽到使用者的反饋,最近我們也在做一些創作者共創的計劃。

AI科技評論:從3D到4D,這中間經歷多長時間的訓練?要克服的技術難點是什麽?之前生成時間30s,4D生成速度要多久?

胡雅婷:時間還好,關鍵是涉及比較多的模態,我們不是一整個端到端的模型,會有數十個垂類模型,每個模型負責處理並解決一類問題,然後串起整個流程。

即將釋出4D,但這個4D會是狹義的,我們會讓一個模型先能動起來。但是所說的全面4D,它可以實作整個空間的互動,也就是直接可以從指令碼生成影視級的動畫,需要涉及更多的模態,包括角色互動、場景互動、物理模擬等等。我覺得要把整個CGI 的流程 AI化,最起碼還得3-5年的時間。

生成簡單的4D不會比生成3D的時間用得久,因為一個復雜模型的骨骼點也就幾十個點,只需要每一幀去生成這幾十個關節點的向量,所以它的生成效率很高,可以做到即時生成。

AI科技評論:實作4D技術路線你們是直接做視訊模型,把視訊模型變成4D還是用圖生成 3D,再把 3D變 成4D?

胡雅婷:其實是用圖生成 3D,再把 3D變成4D的技術路線。4D之後你就可以渲染成一個視訊,你可以設定你的虛擬場景,在生成器裏可以合成實拍的視訊。

AI科技評論:和影眸科技、Luma AI等相比,你們的有利競爭是什麽?

胡雅婷:首先,我們的定位不是一家AI 3D 的公司,我們做的事情是以3D原生去生成動畫數據,然後渲染合成一個視訊。AI 3D的創作門檻還是比較高,真的能編輯3D檔的人還是比較少,所以我們更希望它能輸出動畫視訊,相比目前市場上的AI視訊,我們會有更好的角色一致性和場景連續性,利於創作者創作長期的內容。

其次,我們的產品有更好的可控制性,創作者可以直接控制想要的角色,放進某一個場景,需要連線到某一個動作。最後,可編輯性也是我們的優勢,相當於原生有向量化以及分層的表示,創作者可以更好去編輯。

AI科技評論:AI生成動畫裏角色動作振幅越大,就代表技術難點可能更多嗎?

胡雅婷:具體要看運用什麽樣的技術方案,現在有一類AI動畫仍然使用AI視訊的技術方法,一幀一幀生成每個像素。但我們所說的3D動畫走偏骨骼動畫的方法,它生成的是骨骼點,所以骨骼是可以有很大的振幅。所以技術路線會導致訓練和效果的不同。

「對我來說,創業是去標簽的過程」

AI科技評論:為什麽能在海外爆火,你覺得Aiuni AI做對了什麽?

胡雅婷:首先,開源模型Unique3D,我們覺得它的精度和還原度是現在3D方案裏最高的。 透過很多創作者的反饋,他們對於生成動畫的精度和還原度都有很高的需求,他們不希望自己的設計被改變。

其次,我們生成的動畫藝術性和設計感會更強,比較適合在新媒體場景做傳播。

AI科技評論:你們和多家動畫、影視、品牌、IP行業的上市公司及大廠有戰略合作,能展開講2個具體合作嗎?

胡雅婷:和Nano Labs 合作了3D生成的系統,他們更想在AR拍攝以及3D打印的領域有一些套用。還有國內目前最大的動畫上市公司奧飛娛樂,和他們旗下很知名的IP合作了AR拍照以及衍生品。

也和互聯網的大廠有合作,像支付寶采購過數位星球的生成器;小紅書和字節當時做了很多AR的虛擬服飾;還有一些影視公司,合作了一些偏特效的視訊。

AI科技評論:商業化模式會是什麽樣的?

胡雅婷:我們做過B端的商業化,接下來主要面向C端。C端這邊只要將模式跑通,它的增量更規模化。我們主要想做訂閱制,以專業度和生成量去做一個階梯的區分。

IP授權也是比較好的商業模式,就是指作為一個使用者,創作了某一些角色或者特效的樣版,其他的使用者或者B端也可以來授權使用,形成創作者經濟。

這一塊我們發現,各種AI生態裏,國內使用者的創造性和供應能力更強一些。

AI科技評論:相比成熟的連續創業者,你覺得作為00後創業者,和他們相比,最大的優勢是什麽?

胡雅婷:首先,不能和成熟的創業者競爭偏傳統或較成熟的AI領域,你肯定卷不過他們。年輕人還是要做新模態的東西,得做下一個模態的技術,挖掘新生代使用者的需求和場景,你得找到這種優勢。

其次,整個3D和4D的演算法每天可能都會有新技術出現,即使你在互聯網大廠有再多的AI經歷,大家面對它們也都是全新的起點。還有套用場景,無論是新媒體博主、原創角色還是二創場景,主要活躍使用者也都是00後為主。

最後,團隊協作我們更去中心化,工作不需要打卡,有些同事可能中午才來工作,但他會工作到淩晨。我們不會有硬性的要求,推著大家去工作,而是給大家更多的自由。

胡雅婷,照片來源:受訪者提供

AI科技評論:很多人稱你為北大00後學霸、天才,如果讓你重新定義自己,你喜歡怎麽稱呼自己?

胡雅婷:在青春期,可能會用標簽給自己定義,但創業對我來說就是去掉標簽的過程。我就是希望我創造的這些東西可以不被定義。我希望自己創作的產品會是一個高於自我的存在,我就是不想要被定義才會去做這些事情。

AI科技評論:你喜歡圖形學,那你喜歡皮克斯嗎?

胡雅婷:我很喜歡皮克斯,很關註他們整個創業的過程以及創造的方法。一開始關註是因為三維,最早提出三維Mesh的發明人就是皮克斯的創始人。

他們確實是把新的技術和藝術形態做了很好的結合,回顧他們的整個創業經歷,他們不會過度的強調技術,更關註到底什麽是好的內容?使用者對於好的內容的真實需求是什麽樣的?怎麽去講一個好的故事?

AI科技評論:眼下你覺得最要緊解決的問題是什麽?

胡雅婷:我們得實作從三維產品到套用的閉環。現在各家3D生成,圖片生成3D到3D檔,我覺得它就是一個很薄的工具。

但是如果可以實作生成動畫,使用者可以匯出檔直接釋出成一個新媒體視訊,並且這個新媒體視訊又可以成為創作者經濟的來源,這就是一個很好的閉環。相當於用技術創造了使用者的價值,並且它可以實作更好地增長和規模化。

AI科技評論:你會擔心有更多的人來做這件事情嗎?你的競爭力在哪裏?

胡雅婷:偏 IP 以及藝術類的賽道,品牌相應會強一點。它很關鍵的點,首先你得第一個做,要有搶先優勢,它和技術搶先優勢不一樣,類似迪士尼是第一個做有聲動畫的,大家會比較認這件事情。

當然我們需要透過品牌效應,更好地構建創作者的生態,他們會帶來網路效應,這不是一個純技術或者產品上的復制就可以被人替代的。

AI科技評論:你有設想過未來它會變成一個什麽樣的產品?

胡雅婷:未來會有很大的想象空間,我們在做的 3D 動畫,它和傳統的視訊最不同的就是它本身是一個空間視訊。所以它相容到下一代的MR裝置,就完全會是一個新的互動模態,類似Vision Pro。

在未來的這種空間視訊裏,你可以直接和角色互動,你會覺得角色在你面前和你打招呼。這個和之前的內容模態會完全不同,所以我覺得在這個時代你是有機會構建一個新的內容平台,去連線新一代的創作者和消費內容的場景。

AI科技評論:很多人會覺得 AI 套用其實目前已經到了一個增長的瓶頸,從你個人來看,你覺得 AI套用有未來嗎?

胡雅婷:我覺得 AI 套用還得是模型的模態和套用場景相匹配,如果是一個套殼肯定是不太行的。

比如,做4D相當於是新的數據結構,你要找到合適的套用場景並訓練匹配的模型演算法,它是可以不斷增長,有一個比較好的迴圈。但我覺得這種產品它不可能在今年突然爆發,在原有數據和使用者數據中需要一定持續的積累。

(雷峰網)

(雷峰網)