当你在
Instagram
或
Facebook
上发布内容时,你可能以为这仅仅是与朋友、家人和其他几个人分享。然而,事实远不止如此。你所发布的一切都在被用来训练
Meta
的强大人工智能。在上周
Meta
的财报电话会议上,马克
·
扎克伯格炫耀了他拥有的庞大内容库,其中包括你所有的帖子、短视频和评论。你的社交媒体档案现在成为了地球上最有价值的数据集之一,而
Meta
声称拥有它们的所有权。
「 在 Facebook 和 Instagram 上,有数百亿张公开分享的图片和数十亿个公开视频, 」Meta 的 CEO 在上周的财报电话会议上说。 「 我们估计这超过了 Common Crawl 数据集,人们还在我们的服务中分享了大量的公开文本帖子和评论。 」 这是 Meta 的下一个大动作。
在过去的 20 年里, Instagram 和 Facebook 吸引了用户,并确保通过广告商在每一步都对我们进行货币化。现在,他们正在重新利用你的旧帖子、特殊时刻和重大生活更新,用它们来创建价值数十亿美元的 AI 工具。扎克伯格对 Meta 庞大数据集的夸耀,在【纽约时报】因知识产权问题起诉 OpenAI 后不久发生。但 Meta 正采取其老策略:尽可能多地从 Instagram 和 Facebook 用户那里提取价值。 Meta 多年来一直从用户数据中获利,但从未达到这种程度。
埃隆 · 马斯克也在做同样的事情,使用 X 上的所有 Twitter 内容来训练 xAI 的 Grok 。
Meta 在 9 月份透露,公司正在使用公开的 Facebook 和 Instagram 帖子来训练其新的 AI 助手。作为参考,扎克伯格提到的 Common Crawl 数据集收集了 17 年来超过 2500 亿个网页。这是人类的最大互联网数据库之一,被视为训练大型语言模型的黄金标准。
扎克伯格基本上在其货架上发现了一座金矿。大约二十年来积累的 Facebook 和 Instagram 帖子库现在成为了公司最有价值的资产之一。没有任何宏大的声明或通知用户, Meta 实质上宣称拥有你公开的社交媒体档案的所有权,并将使用它来产生数十亿美元的收益。