OpenAI 的 GPTBot 进军网络——你需要了解什么

经过

爱德华·霍普兰

阅读时长：2分钟 2023年8月8日

OpenAI

该工具的主要功能是网络爬虫，即通过一个通常被称为网络蜘蛛的机器人，对浩瀚的互联网上的网站内容进行索引。.
这项新的网络爬虫计划是在 OpenAI 最近提交“GPT-5”商标申请之后进行的，GPT-5 预计将是现有 GPT-4 模型的继任者。.
OpenAI 的创始人兼首席执行官 Sam Altman 警告说，该公司距离开始 GPT-5 训练还有相当长的一段时间。.

知名人工智能公司 OpenAI 近日推出了其最新工具“GPTBot”，该工具专为网络爬虫而设计，有望为其 ChatGPT 模型未来迭代的改进铺平道路。.

OpenAI 在最近的一篇博文中宣布推出 GPTBot，并强调了它在增强即将推出的 ChatGPT 版本方面的潜力。该工具的主要功能是网络爬虫，即通过一个通常被称为网络蜘蛛的机器人，对浩瀚的互联网上的网站内容进行索引。这使得谷歌和必应等搜索引擎能够在搜索结果中显示相关的网站。.

OpenAI 解释说，GPTBot的设计目的是从各种网络资源中收集公开信息。但是，它被编程为排除付费墙后的内容、涉及个人身份信息的来源dent违反OpenAI既定政策的文本。值得注意的是，网站所有者可以通过在其服务器上的标准文件中插入“disallow”命令来阻止GPTBot的抓取活动。

重磅消息🚨

OpenAI刚刚发布了GPTBot，这是一款网络爬虫，旨在自动matic整个互联网的数据。

这些数据将用于训练未来的AI模型，例如GPT-4和GPT-5！

GPTBot会确保排除侵犯隐私和需要付费才能访问的内容。pic.twitter.com /oR3kY4buaU
— Shubham Saboo (@Saboo_Shubham_) 2023年8月7日

这项新的网络爬虫项目紧随OpenAI近期提交的“GPT-5”商标申请之后。“GPT-5”预计将是现有GPT-4模型的继任者。该申请于7月18日提交至美国专利商标局，涵盖了“GPT-5”一词在各种人工智能应用中的使用，包括文本和语音转换、音频到文本的翻译以及语音识别。

OpenAI 的下一代模型计划

然而，尽管人们对GPT-5充满期待，OpenAI的创始人兼首席执行官Sam Altman却谨慎地表示，该公司距离正式开始GPT-5训练还有相当长的一段时间。他强调，在启动训练过程之前，需要进行全面的安全审计。.

OpenAI 已提交“GPT-5”商标申请，其中包括用于以下用途的软件： “人工生成人类语音和文本” 、 “将音频数据文件转换为文本” 、“语音识别”和“基于机器学习的语言和语音处理” 👀 pic.twitter.com/54aJBovDNB

— YK aka CS Dojo 📺🐦 (@ykdojo) 2023年8月1日

与此同时，OpenAI的数据收集做法，尤其是版权和用户许可问题，引发了越来越多的担忧。今年6月，日本隐私监管机构就 OpenAI 未经授权收集敏感数据一事向其发出警告。意大利也以违反欧盟隐私法为由，暂时禁止使用ChatGPT。这些事件凸显了数据隐私和人工智能技术正受到越来越多的关注。

值得注意的是，OpenAI 近期面临一起由 16 名原告提起的集体诉讼，原告声称该公司获取了用户与 ChatGPT 互动中的私人信息。该诉讼还将微软列为被告，并指出如果指控属实，两家公司都可能被认定违反了《计算机欺诈和滥用法案》（Computer Fraud and Abuse Act），该法案历来适用于网络爬虫案件。.

随着 OpenAI 利用 GPTBot 进军网络爬虫领域，它为改进其人工智能模型开辟了新的可能性。然而，这些发展也伴随着法律和伦理方面的考量，因为人工智能行业正在努力寻求创新、隐私和负责任的数据使用之间的微妙平衡。.

最顶尖的加密货币专家都在阅读我们的简报。想加入他们？

分享这篇文章