出版商阻止AI机器人以保护内容

Image by AbsolutVision, from Unsplash

出版商阻止AI机器人以保护内容

阅读时间: 1 分钟

新闻出版商继续与AI机器人进行斗争,起诉科技公司,警告说数据抓取对新闻业、公平的薪酬体系,以及开放网络的未来构成威胁。

时间紧吗?以下是要点:

  • 像ChatGPT这样的AI工具减少了新闻网站的流量。
  • Cloudflare推出了工具来帮助阻止未经授权的AI抓取器。
  • Reddit和iFixit已经起诉或阻止了像Anthropic这样的AI公司。

根据《华尔街日报》(WSJ)的一份新报告中,新闻出版商们正在反击那些未经付费就从他们的网站上抓取内容的AI公司。随着像ChatGPT和Google的Gemini这样的AI工具的增长,许多媒体公司正在试图阻止未经许可使用他们作品的机器人。

“你希望人类访问你的网站,而不是机器人,尤其是那些对你没有任何价值的机器人,”大西洋月刊的CEO尼古拉斯·汤普森说。该杂志与OpenAI有许可协议,但计划阻止其他AI公司的访问,据《华尔街日报》报道。

这种策略,称为”抓取”,自谷歌早期时代就已存在。那时,搜索引擎为出版商的网站带来了流量。现在,AI聊天机器人使得新闻摘要可以引导读者离开他们的原始来源。机器人驱动的流量减少以及广告收入的下滑已经成为许多出版商面临的普遍问题。

为了进行反击,出版商们正在求助于像Cloudflare这样的科技公司,该公司最近推出了工具,让网站能够控制AI机器人是否可以访问内容。Dotdash Meredith的CEO Neil Vogel,他的公司也向OpenAI授权了内容,他表示:“创造知识产权的人需要得到保护,否则没有人会再创造知识产权了,”WSJ报道称。

一些公司,如Reddit和iFixit,已经采取了法律行动。Reddit起诉AI公司Anthropic,尽管已多次要求停止,但该公司仍然抓取超过100,000次。iFixit表示,Anthropic在一天之内对其服务器进行了一百万次的访问。

这场斗争也在法庭上上演。《纽约时报》正在起诉微软和OpenAI,而新闻集团及其子公司则在对抗Perplexity。 BBC也威胁要对AI初创公司Perplexity采取法律行动,指控它刮取其内容以训练其默认模型。

同时,一些人担心,更严格的反刮取规则可能会阻止合法用途,如《华尔街日报》所注意到的学术研究。

正如数据溯源倡议的Shayne Longpre所警告的,“网络正在被划分给出价最高的竞标者。这对市场集中度和开放性非常不利,”据《华尔街日报》报道。

你喜欢这篇文章吗?为它打分!
我非常不喜欢 我不怎么喜欢 一般 挺好! 非常喜欢!

我们很高兴您喜欢我们的作品!

尊贵的读者,您介意在Trustpilot上给我们点赞吗?这很快,但对我们来说意义重大。不胜感激!

在Trustpilot上给我们评分
00 用户投票
标题
评论
谢谢你的反馈