扎克伯格炫耀：你的Facebook和Instagram内容将助力其AI发展

2024-02-10科技

当你在 Instagram 或 Facebook 上发布内容时，你可能以为这仅仅是与朋友、家人和其他几个人分享。然而，事实远不止如此。你所发布的一切都在被用来训练 Meta 的强大人工智能。在上周 Meta 的财报电话会议上，马克 · 扎克伯格炫耀了他拥有的庞大内容库，其中包括你所有的帖子、短视频和评论。你的社交媒体档案现在成为了地球上最有价值的数据集之一，而 Meta 声称拥有它们的所有权。

「在 Facebook 和 Instagram 上，有数百亿张公开分享的图片和数十亿个公开视频，」Meta 的 CEO 在上周的财报电话会议上说。「我们估计这超过了 Common Crawl 数据集，人们还在我们的服务中分享了大量的公开文本帖子和评论。」这是 Meta 的下一个大动作。

在过去的 20 年里， Instagram 和 Facebook 吸引了用户，并确保通过广告商在每一步都对我们进行货币化。现在，他们正在重新利用你的旧帖子、特殊时刻和重大生活更新，用它们来创建价值数十亿美元的 AI 工具。扎克伯格对 Meta 庞大数据集的夸耀，在【纽约时报】因知识产权问题起诉 OpenAI 后不久发生。但 Meta 正采取其老策略：尽可能多地从 Instagram 和 Facebook 用户那里提取价值。 Meta 多年来一直从用户数据中获利，但从未达到这种程度。

埃隆 · 马斯克也在做同样的事情，使用 X 上的所有 Twitter 内容来训练 xAI 的 Grok 。

Meta 在 9 月份透露，公司正在使用公开的 Facebook 和 Instagram 帖子来训练其新的 AI 助手。作为参考，扎克伯格提到的 Common Crawl 数据集收集了 17 年来超过 2500 亿个网页。这是人类的最大互联网数据库之一，被视为训练大型语言模型的黄金标准。

扎克伯格基本上在其货架上发现了一座金矿。大约二十年来积累的 Facebook 和 Instagram 帖子库现在成为了公司最有价值的资产之一。没有任何宏大的声明或通知用户， Meta 实质上宣称拥有你公开的社交媒体档案的所有权，并将使用它来产生数十亿美元的收益。