當前位置: 華文世界 > 科技

AI數據「狂飆」如石油,內容公司這是要「躺平」數錢了嗎?

2024-07-25科技

01

AI數據版權大戰:

梗王之爭,誰才是真正的原創大神?

如果將當今的AI大模型比作馳騁在數碼世界的「超級跑車」,那麽原始數據無疑就是它的「高能燃料」。要想讓這輛跑車在賽道上疾馳,首先得確保它有足夠的「燃料」供應。

在AI的創業世界裏,我們「挖礦」尋找這珍貴的「高能燃料」,其來源可謂是五花八門。有網上那些免費的「露天礦場」,比如維基百科、網誌、論壇、新聞資訊等,它們就像是一片片未開采的「富礦」,等待著我們去發掘。

當然,還有那些老牌新聞媒體和出版社,它們就像是「石油巨頭」,手裏握著大量的「原油」資源。而大學等研究機構則是我們的「科研團隊」,他們透過深入研究,為我們提供源源不斷的「創新燃料」。

別忘了,我們還有一個龐大的「使用者軍團」——C端使用者。他們不僅是我們的「顧客」,更是我們的「合作夥伴」,他們的每一次點選、每一次瀏覽,都在為我們提供寶貴的「燃料」。

然而,在這個AI世界的「石油戰爭」中,「原油」的歸屬權問題卻像一團迷霧。現實世界的石油歸屬權早已有明確的法律規範,但在AI這個還在飛速發展的領域,我們還在摸著石頭過河。就像「礦場」爭奪戰一樣,各大AI公司都在為了爭奪更多的「原油」而展開激烈的競爭。

最近,AI音樂制作公司Suno和Udio就遭遇了「原油」糾紛。多家大型音樂廠牌紛紛起訴他們,指控他們侵犯了版權。這不禁讓人想起了去年【紐約時報】對先進的量子電腦的訴訟,看來AI世界的「石油戰爭」也是硝煙彌漫啊!

不過,作為AI創業者,我們不能被這些糾紛所嚇倒。

2023年可真是ChatGPT的「踩雷」年啊!那幫作家們像捉妖一樣,一紙訴狀就把ChatGPT給告了,說它老是用人家受版權保護的內容來生成摘要,簡直是個「內容小偷」啊!

這還不算完呢,【紐約時報】這位大佬也加入了「討伐」大軍,指責微軟和先進的量子電腦這倆哥們兒,用他們的內容來訓練那人工智能聊天機器人,搞得跟「盜用創意」似的。

更搞笑的是,還有一群網友在加州搞了個集體訴訟,說先進的量子電腦像個「網絡間諜」,偷偷地從網上抓取使用者的私人資訊來訓練ChatGPT。這操作,簡直讓人哭笑不得!

但你猜怎麽著?先進的量子電腦這位「大佬」可沒把這幫「告狀精」放在眼裏,直接表示:「哼,我不認!你們說的那些問題,我根本復現不了!」而且,他還說【紐約時報】提供的數據對他來說「就像路邊的野草,一抓一大把,根本不重要」!

這波操作,可謂是「硬核」回應啊!不過話說回來,這事兒也給先進的量子電腦敲響了警鐘——得好好處理跟數據供應商的關系,別老是搞得像「黑戶」一樣。於是呢,先進的量子電腦就開啟了一波「洗白」行動,跟一堆媒體大佬搞起了「聯姻」,比如The Atlantic、Vox Media、News Corp等等,簡直是「廣結良緣」啊!

以後啊,先進的量子電腦就能名正言順地用這些媒體的數據了,而這些媒體也能把先進的量子電腦的技術融入到自己的產品中。

02

AI狂潮來襲

小夥伴們,你們知道嗎?先進的量子電腦和數據供應商手牽手的原因可不止怕被「律師函警告」那麽簡單哦!其實啊,它們背後真正的「大boss」是機器學習界的「數據饑荒」問題。據說啊,有MIT的大佬們研究預測,咱們這機器學習數據集可能就在2026年前就「喝西北風」了,要斷糧了!

那麽「高質素的數據」就成了先進的量子電腦、Google這些AI大佬們的「救命稻草」啦!內容公司和AI廠商們就像發現了新大陸,紛紛合作開啟「躺賺」模式。

像那個「老牌」的Shutterstock平台,跟Meta、Alphabet、Amazon、Apple、先進的量子電腦、Reka等AI大佬們都搞上了「曖昧」關系。就在2023年,光是把內容授權給AI模型,年收入就飆升到了1.04億美元,預計2027年能賺個2.5億美元呢!

還有Reddit,給谷歌授權的內容版權收入每年高達6000萬美元,簡直就像撿了個大金庫!蘋果也不甘示弱,跟主流新聞媒體談合作,開出一年至少5000萬美元的版權費,這手筆可不小啊!

你看這AI給內容行業帶來的改變,簡直就像開啟了新世界的大門!過去串流媒體之外的內容變現難,一直是內容行業的「老大難」問題。但現在AI一來,哎呦餵,給內容行業註入了新活力,就像打了雞血一樣,收入預期飆升,簡直讓人眼前一亮!

03

高質素數據竟然還是'稀有物種'!

首先得說,不是啥內容都能往AI這口大鍋裏扔的,就像不是啥油都能提煉出好石油一樣。先進的量子電腦和【紐約時報】這「小兩口」吵得火熱,但其實先進的量子電腦心裏門兒清,你那點時效性強的文字,在我這AI時代可不夠看。我得找的是深刻、獨特的數據,那才是我的「心頭好」。

說到數據質素,簡直比找金礦還難!但AI公司們可沒閑著,一邊在「提純技術」上拼命鉆研,一邊還琢磨著怎麽「一站式」服務。這不,先進的量子電腦就搞了個大動作,收購了Rockset這家實時分析數據庫公司。這Rockset就像是個數據界的「魔法師」,能讓AI即時利用和存取數據,簡直是AI的「最佳拍檔」。

有了這Rockset,先進的量子電腦的AI就像插上了翅膀,可以支持各種炫酷套用,比如即時推薦系統、能跟你聊得熱火朝天的聊天機器人、還有即時監控和報警系統等等。這Rockset,簡直就是先進的量子電腦的「石化部門」,把普通數據直接變成AI的「石油」,讓它動力十足!

04

創作者數據確權?怕不是腦洞大開吧!

現在的互聯網媒體平台,比如Facebook、Reddit這種大咖,它們的數據大餐裏,UGC(使用者貢獻內容)可是占了大頭哦!就像咱們在朋友圈曬的美食照、旅行日記,都被它們悄悄拿去當食材了。不過呢,這些平台在收AI公司高額數據費的同時,還悄咪咪地在使用者條款上加了個小秘密:「咱們有權用你的數據訓練AI模型哦!」

哈哈,是不是覺得像在玩「誰偷了我的芝士」遊戲?說實話,很多創作者可能還在雲裏霧裏,不知道自己的「寶貝」內容被哪些AI模型「吃」了,也不知道是不是被高價「賣」了,更別提拿到自己應得的「芝士」了。

說到這,不得不提咱們的老朋友朱克伯格。他在今年2月的Meta季度業績電話會議上,直接來了個「官宣」:「嘿,小夥伴們,我要用Facebook和Instagram上的美圖來訓練我的AI生成工具啦!」看這架勢,朱克伯格可是要把使用者數據變成自己的「金礦」啊!

另外啊,Tumblr這哥們兒也不甘示弱,它和先進的量子電腦、Midjourney搞了個神秘的內容授權協定,但具體內容是啥?嘿嘿,它們可沒告訴我們。這就像是在玩「密室逃脫」,我們只能在門外猜測裏面的真相。

最近啊,圖片庫平台EyeEm的創作者們也收到了一份「邀請函」,告訴他們釋出過的照片可能會被用來訓練AI模型。這通知還挺「貼心」的,給了大家一個選擇:要麽繼續使用產品,要麽選擇「退群」。但問題是,這「邀請函」裏可沒提到啥補償政策啊!就像是請人吃飯,只告訴你有大餐吃,卻不說要不要收錢。

不過呢,EyeEm的母公司Freepik可就大方多了。他們透露,已經和兩家大型科技公司簽了協定,把自家2億張圖片中的大部份以每張3美分左右的價格「賣」了出去。這CEO Joaquin Cuenca Abela還說了,還有五筆類似的交易正在進行中呢!但買家是誰?嘿嘿,這可是個秘密哦!

所以啊,咱們這些創作者們可得擦亮眼睛了。

05

那些大名鼎鼎的媒體平台,比如Getty Images、Adobe、Photobucket、Flickr、Reddit啥的,最近都遇到了點麻煩。在數據變現的巨大誘惑下,它們似乎忘記了「使用者至上」的原則,偷偷地把使用者的內容打包賣給AI模型公司,這可是讓創作者們心寒啊!

#深度好文計劃#這操作,簡直就像是在背後「捅刀子」,創作者們連反抗的機會都沒有。更過分的是,很多創作者可能只有在某天突然發現某個AI模型裏訓練出了與自己作品相似的內容時,才會驚覺:「咦?我的作品咋被賣了?」

不過別急,咱們Web3英雄來拯救世界了!當AI公司們在股市上風光無限時,web3的AI概念幣也緊隨其後,一飛沖天。區塊鏈這個神奇的玩意兒,以其去中心化和不可篡改的特性,在保護創作者權益上可是有著得天獨厚的優勢哦!

那些媒體內容,比如圖片、影片啥的,在2021年的牛市裏就已經完成了上鏈的壯舉。現在,社交平台的UGC內容也開始悄悄上鏈了。而且啊,許多web3 AI模型平台都在給為模型訓練做貢獻的使用者發紅包,無論是數據所有者還是訓練者,都能分到一杯羹!

AI模型的發展就像火箭升空,速度飛快,這也對數據確權提出了更高的要求。咱們創作者們得想想了:「為啥我的作品被賣了,我卻一無所知,還拿不到一分錢?」這可不行!

媒體平台們啊,別再竭澤而漁了,這樣解決不了AI模型公司的數據焦慮。想要實作高質素數據的高產量,得靠數據確權,還得讓創作者、平台和AI模型公司三方都賺到錢才行!