人工智能机器人值得屏蔽吗？还是应该允许它们存在？

经过

阅读时长：3分钟发布日期：2024年4月17日

AI爬虫机器人像搜索引擎机器人一样，会在网络上搜寻内容。.
它们与其他来源一起，是 LLM 培训数据来源的重要组成部分。.
是否允许机器人访问取决于发布者的优先级以及对机器人访问影响的假设。.

OpenAI 在推出聊天机器人 ChatGPT 的同时，也发布了名为 GPTBot 的网络爬虫。该爬虫的工作方式与 Google 机器人类似，网站所有者可以通过 robots.txt 文件阻止这些爬虫访问其网站。OpenAI 也提供了屏蔽其机器人的途径。据 Originality.AI 的一项研究显示，约有 48% 的网站已屏蔽了 GPTBot 的访问。此后，Google 也发布了独立的 Google Extended 机器人，以便网站管理员能够在不影响其搜索引擎的情况下屏蔽 Google 的 AI 工具。.

关于人工智能机器人的争论仍在继续

自 ChatGPT 发布以来，关于如何利用其阻止部分 AI 机器人访问网站的功能一直争论不休。目前尚无一个能够让所有利益相关者都满意的答案，因为围绕这一问题的讨论在 SEO 行业人士和几乎所有在线出版物中都持续不断。至于阻止这些机器人是否会产生任何实际影响，则属于次要问题，因为许多服务未经许可就会搜索网络。

支持这种观点的一个论据是，OpenAI 的爬虫发布得相当晚。该公司可能使用了多种不同的方法来获取数据，他们称这些数据在网络上广泛可用。令人担忧的是，公司可以使用不同名称和不同供应商的爬虫，因此，即使你屏蔽了一个新的爬虫，也无法收回已被其抓取的数据。.

这使得网络爬虫网站更容易利用这些用你的数据（也就是人类生成的数据）训练的机器人来大量生成内容。.

他们想要你的内容

有些人可能认为人工智能公司并不想要他们的内容，而且它们终有一天能够生产出与你的内容质量相当的内容，这对以内容为中心的网站来说是一个非常令人担忧的问题。这也引发了人们对我们熟知的搜索引擎优化（SEO）实践的有效性和相关性的质疑。另一个问题是，届时将有大量网站生产完全相同的内容。因此，考虑到这些因素，一些行业可能会大规模地屏蔽人工智能机器人。.

支持开放 ChatGPT 等机器人访问权限的专家认为，该服务并非用作搜索引擎，而是用作助手，尤其是在代码编写、翻译和内容创作方面。他们还指出，自 Bing 整合 ChatGPT 以来，其市场份额仅增长了 1%。目前，谷歌声称其人工智能机器人是独立的，但鉴于谷歌未来会将人工智能整合到搜索结果中，我们无法预知未来会发生什么。.

支持者还指出，这不仅仅是聊天机器人撰写内容的问题，关键在于，如果它们提及你的品牌名称，就能让你的品牌触达更广泛的受众。此外，如果你屏蔽它们的访问权限，就能阻止你的想法被用于训练未来的LLM（逻辑逻辑模型）。然而，未来这些模型很tron生成品牌和产品的克隆版本，最终加剧深度伪造问题。

人工智能模型对搜索引擎优化（SEO）和谷歌构成的威胁并非直接的竞争关系，而是作为一种可以大规模生成内容的工具。这会对搜索行业造成颠覆性影响，因为它会给谷歌和必应带来挑战，并抢占原本会流向现有人工内容的。因此，最终是否允许机器人参与搜索，取决于个人（如博主）或出版商（如公司）在分析自身优先事项后做出的选择。

如果你正在阅读这篇文章，你已经领先一步了。订阅我们的新闻简报，继续保持领先优势。

分享这篇文章