當前位置: 華文世界 > 科技

AI的下個前進演化和爆點

2024-07-29科技

文 | 李智勇

產品視角看技術一般不看原理就看效果。

每天會我花點時間觀察AI的最新進展。方法是有API的主要方法就是建立測試集各種測,影片這類的我主要就看非官方出品的到底做成什麽樣了,是不是具有普遍性。

看多了上面這些影片後,我是兩點感想:

第一,影片生成這事真的要到爆的時候了。

第二,GPT5這檻大概率是能過去的,雖然是不是OpenAI先過不好說。

在這個新機會點徹底爆開和現在之間其實是AI的小低潮。

為什麽說影片生成要爆呢?

模型方的官方影片因為有利害牽涉,最多可以看看苗頭,不太能信。

所以得換個視角,如果一般使用者以一定頻次和量級持續往出爆精彩影片,那就差不多到臨界點了。你看當年MJ火起來之前也是這樣,持續各種圖片被爆出來。因為社交網絡上持續爆影片這事必須滿足倆條件:

第一個是質素得讓人驚訝。超出原有認知。

第二個得相對容易和便宜,很多人都能做了。

前一個是時機,後一個是基礎。缺一個也不行。現在那有誰沒事爆圖片的,即使圖片比過去做的還驚艷,也沒人看啊。

現在看這倆條件基本滿足了,只差一點點。一旦這個滿足了,就變成AI的下個大眾型機會點。

為什麽說是大眾機會呢?

AIGV(Video)這是我杜撰的一個詞,但確實應該區分生成文本、圖片和影片。因為他們影響量級就不可能一樣。國內的頭部主播收入和過去博主收入就不在一個數量級上,甚至都不是十倍百倍的差異。假如抖音上市等於多少個小紅書和知乎呢?

現在這個影片生態面臨洗牌,一波人要上機關槍了,另一波人還是大刀長矛,所以這影響恐怕比過去文章生成大的多。他會推進影片平台往不可測的方向發展。

影片平台外的部份我們反倒是能看的清楚一些,甚至發展路線過去都操練過一遍了。

先是新版李一舟會出一波。這時候的內容生成面臨雙重專業性,一部份是影片生成的模型,一部份則是影片本身的某些技巧。

也還是會有套殼的工具,Heygen這種不完全產生影片的工具都每年2000萬美金,這裏的新工具應該價值更大。

然後大量AI生成的內容會進入各個平台。各個平台估計會有點糾結,但最終還是會像現在這樣,基本還是允許,最多加個標註。

再往後會往縱深發展,不停留在宣傳片這個層次,而是向短劇(段子、動畫等)發展。這時候會再炸一下,因為和上一波的進展就重疊了。之前AI碰撞局上,周瑋分享過他寫短篇小說的Agent,聽過後你就知道這類產品再結合上影片生成能力,特別的契合。這類產品的價值空間一下子就會上來很多。

再之後估計就是長劇和直播。其中直播稍微復雜點,因為要和經常說的動捕做結合,做到特別逼真恐怕還要花點時間。

最後肯定是電影。扔本小說,AI改出劇本,AI生成電影,這是什麽感覺?

先縱後橫的AI

之前文章中提到過幾次,AI和互聯網最大的不一樣是先縱後橫,像打深井,現在這裏深井又多了一口。

文圖是一口井,影片是一口井,並且更深更大。

更有意思的是這是個大眾機會,大廠好像也不能基於這個做什麽壟斷產品。

每個人差不多是平等的,它輔助你的創意實作,培養一批工具和教工具的人。

先縱後橫會導致這這麽一個狀態:它不會一下子炸的那麽厲害,比如一下子就出個微信,但會持續炸。

這時候面對它的基本方法論根本不是高瞻遠矚,而是要回到現場,需要AI碰撞局這類把案例聚集起來的,讓大家能鮮活感受AI套用現場的手段。

再簡單了說就是實事求是,得知道情況是什麽,別人幹成什麽樣了,然後形成自己判斷,自己不理解的就當不存在,至少不能用來做事。

這和互聯網非常不一樣。那個是一波大浪沖到底過去就過去了。

徹底成熟了什麽樣?

我之前發了這麽個影片,沒想到自己讀者群(進讀者群大家發私信吧)裏還有幾個這方面專家,又多聊了幾句我就發現這是個成熟產業。

上面的生成影片技術一成熟再加上影片裏的這套技術,有可能催生這種產品:

一個人有一個自己的分身,這個分身就是影片裏那種產品,然後生成指令碼、生成內容、釋出是全自動的,你對著說它就能釋出內容。剪映什麽的就不要了。這市場應該還很大,真有願意幹的可以試試。

這東西就每人多一個手機,但這手機能自己動起來,生成內容釋出內容,和直播架子、話筒什麽的其實差不多,需要的量還很大。有人估計用去做水軍,但那是做水軍違法,就和有人用手機打詐騙電話,但不能說是電話的問題類似,無人機不也用來扔炸彈麽。

GPT5最終肯定會來

看著影片的進展,我就比較確定GPT5肯定會來。

現在GPT5是個符號,也說不清到底是什麽,隱喻就是AI能再進展一步。倒不一定是OpenAI的下個版本,它標識著通用智能是否還能再跳一級,智能的通用性每跳一級,其影響和單純生成影片肯定不一樣。

為什麽說GPT5一定會來呢?

比如說理解物理世界有自己世界模型這事,在生成文字和圖片的時候理不理解物理世界是不關鍵的。但生成影片的時候如果不理解物理世界,細微的地方是做不好的。

解讀為什麽可以看論文,但看結果就是AI對物理世界的理解在深入,它在形成屬於它自己的世界模型。

假如有一天AIGV(Video)能夠生成現實世界的各種電視劇,也能夠生成各種精彩的奇幻電影,那它的世界模型就必然同時覆蓋現實空間和虛擬世界(比如漫威宇宙)。

從這個角度看影片生成和GPT5差不多是同步的。

是不是OpenAI反倒是不好說,OpenAI宮鬥了一場後看著有點抓瞎,總是很隨性的發產品,然後Sam Altman不解決公司迫在眉睫的問題,沒事去發表涉政言論,這怎麽看也路子不對。但這是另外的故事了。

小結

想到AI的終極可能會想到無處安放的自己,並恐慌,但看過程其實它也在創造一個個大眾型機會。在這個時間點,這類充滿活性,還給一般人機會的領域沒想的那麽多了。還是應該多擁抱和碰撞。如果說之前階層固化的程度是1,那AI之後的世界裏可能是100(在我預測的不好的結局裏),所以在不良脈絡裏這可能是最後的機會。