祖克柏炫耀：你的Facebook和Instagram內容將助力其AI發展

2024-02-10科技

當你在 Instagram 或 Facebook 上釋出內容時，你可能以為這僅僅是與朋友、家人和其他幾個人分享。然而，事實遠不止如此。你所釋出的一切都在被用來訓練 Meta 的強大人工智慧。在上周 Meta 的財報電話會議上，馬克 · 祖克柏炫耀了他擁有的龐大內容庫，其中包括你所有的貼文、短視訊和評論。你的社交媒體檔案現在成為了地球上最有價值的數據集之一，而 Meta 聲稱擁有它們的所有權。

「在 Facebook 和 Instagram 上，有數百億張公開分享的圖片和數十億個公開視訊，」Meta 的 CEO 在上周的財報電話會議上說。「我們估計這超過了 Common Crawl 數據集，人們還在我們的服務中分享了大量的公開文本貼文和評論。」這是 Meta 的下一個大動作。

在過去的 20 年裏， Instagram 和 Facebook 吸引了使用者，並確保透過廣告商在每一步都對我們進行貨幣化。現在，他們正在重新利用你的舊貼文、特殊時刻和重大生活更新，用它們來建立價值數十億美元的 AI 工具。祖克柏對 Meta 龐大數據集的誇耀，在【紐約時報】因智慧財產權問題起訴 OpenAI 後不久發生。但 Meta 正采取其老策略：盡可能多地從 Instagram 和 Facebook 使用者那裏提取價值。 Meta 多年來一直從使用者數據中獲利，但從未達到這種程度。

埃隆 · 馬斯克也在做同樣的事情，使用 X 上的所有 Twitter 內容來訓練 xAI 的 Grok 。

Meta 在 9 月份透露，公司正在使用公開的 Facebook 和 Instagram 貼文來訓練其新的 AI 助手。作為參考，祖克柏提到的 Common Crawl 數據集收集了 17 年來超過 2500 億個網頁。這是人類的最大互聯網資料庫之一，被視為訓練大型語言模型的黃金標準。

祖克柏基本上在其貨架上發現了一座金礦。大約二十年來積累的 Facebook 和 Instagram 貼文庫現在成為了公司最有價值的資產之一。沒有任何宏大的聲明或通知使用者， Meta 實質上宣稱擁有你公開的社交媒體檔案的所有權，並將使用它來產生數十億美元的收益。