當你在
Instagram
或
Facebook
上釋出內容時,你可能以為這僅僅是與朋友、家人和其他幾個人分享。然而,事實遠不止如此。你所釋出的一切都在被用來訓練
Meta
的強大人工智慧。在上周
Meta
的財報電話會議上,馬克
·
祖克柏炫耀了他擁有的龐大內容庫,其中包括你所有的貼文、短視訊和評論。你的社交媒體檔案現在成為了地球上最有價值的數據集之一,而
Meta
聲稱擁有它們的所有權。
「 在 Facebook 和 Instagram 上,有數百億張公開分享的圖片和數十億個公開視訊, 」Meta 的 CEO 在上周的財報電話會議上說。 「 我們估計這超過了 Common Crawl 數據集,人們還在我們的服務中分享了大量的公開文本貼文和評論。 」 這是 Meta 的下一個大動作。
在過去的 20 年裏, Instagram 和 Facebook 吸引了使用者,並確保透過廣告商在每一步都對我們進行貨幣化。現在,他們正在重新利用你的舊貼文、特殊時刻和重大生活更新,用它們來建立價值數十億美元的 AI 工具。祖克柏對 Meta 龐大數據集的誇耀,在【紐約時報】因智慧財產權問題起訴 OpenAI 後不久發生。但 Meta 正采取其老策略:盡可能多地從 Instagram 和 Facebook 使用者那裏提取價值。 Meta 多年來一直從使用者數據中獲利,但從未達到這種程度。
埃隆 · 馬斯克也在做同樣的事情,使用 X 上的所有 Twitter 內容來訓練 xAI 的 Grok 。
Meta 在 9 月份透露,公司正在使用公開的 Facebook 和 Instagram 貼文來訓練其新的 AI 助手。作為參考,祖克柏提到的 Common Crawl 數據集收集了 17 年來超過 2500 億個網頁。這是人類的最大互聯網資料庫之一,被視為訓練大型語言模型的黃金標準。
祖克柏基本上在其貨架上發現了一座金礦。大約二十年來積累的 Facebook 和 Instagram 貼文庫現在成為了公司最有價值的資產之一。沒有任何宏大的聲明或通知使用者, Meta 實質上宣稱擁有你公開的社交媒體檔案的所有權,並將使用它來產生數十億美元的收益。