OpenAI 在推出聊天机器人 ChatGPT 的同时,也发布了名为 GPTBot 的网络爬虫。该爬虫的工作方式与 Google 机器人类似,网站所有者可以通过 robots.txt 文件阻止这些爬虫访问其网站。OpenAI 也提供了屏蔽其机器人的途径。据 Originality.AI 的一项研究显示,约有 48% 的网站已屏蔽了 GPTBot 的访问。此后,Google 也发布了独立的 Google Extended 机器人,以便网站管理员能够在不影响其搜索引擎的情况下屏蔽 Google 的 AI 工具。.
关于人工智能机器人的争论仍在继续
自 ChatGPT 发布以来,关于如何利用其阻止部分 AI 机器人访问网站的功能一直争论不休。目前尚无一个能够让所有利益相关者都满意的答案,因为围绕这一问题的讨论在 SEO 行业人士和几乎所有在线出版物中都持续不断。至于阻止这些机器人是否会产生任何实际影响,则属于次要问题,因为许多服务未经许可就会搜索网络。
支持这种观点的一个论据是,OpenAI 的爬虫发布得相当晚。该公司可能使用了多种不同的方法来获取数据,他们称这些数据在网络上广泛可用。令人担忧的是,公司可以使用不同名称和不同供应商的爬虫,因此,即使你屏蔽了一个新的爬虫,也无法收回已被其抓取的数据。.
这使得网络爬虫网站更容易利用这些用你的数据(也就是人类生成的数据)训练的机器人来大量生成内容。.
他们想要你的内容
有些人可能认为人工智能公司并不想要他们的内容,而且它们终有一天能够生产出与你的内容质量相当的内容,这对以内容为中心的网站来说是一个非常令人担忧的问题。这也引发了人们对我们熟知的搜索引擎优化(SEO)实践的有效性和相关性的质疑。另一个问题是,届时将有大量网站生产完全相同的内容。因此,考虑到这些因素,一些行业可能会大规模地屏蔽人工智能机器人。.
支持开放 ChatGPT 等机器人访问权限的专家认为,该服务并非用作搜索引擎,而是用作助手,尤其是在代码编写、翻译和内容创作方面。他们还指出,自 Bing 整合 ChatGPT 以来,其市场份额仅增长了 1%。目前,谷歌声称其人工智能机器人是独立的,但鉴于谷歌未来会将人工智能整合到搜索结果中,我们无法预知未来会发生什么。.
支持者还指出,这不仅仅是 聊天机器人撰写内容的问题,关键在于,如果它们提及你的品牌名称,就能让你的品牌触达更广泛的受众。此外,如果你屏蔽它们的访问权限,就能阻止你的想法被用于训练未来的LLM(逻辑逻辑模型)。然而,未来这些模型很tron生成品牌和产品的克隆版本,最终加剧深度伪造问题。
人工智能模型对搜索引擎优化(SEO)和谷歌构成的威胁并非直接的竞争关系,而是作为一种可以大规模生成内容的工具。这会对搜索行业造成颠覆性影响,因为它会给谷歌和必应带来挑战,并抢占原本会流向现有 人工内容的。因此,最终是否允许机器人参与搜索,取决于个人(如博主)或出版商(如公司)在分析自身优先事项后做出的选择。

