知名人工智能公司 OpenAI 近日推出了其最新工具“GPTBot”,该工具专为网络爬虫而设计,有望为其 ChatGPT 模型未来迭代的改进铺平道路。.
OpenAI 在最近的一篇博文中宣布推出 GPTBot,并强调了它在增强即将推出的 ChatGPT 版本方面的潜力。该工具的主要功能是网络爬虫,即通过一个通常被称为网络蜘蛛的机器人,对浩瀚的互联网上的网站内容进行索引。这使得谷歌和必应等搜索引擎能够在搜索结果中显示相关的网站。.
OpenAI 解释 说,GPTBot的设计目的是从各种网络资源中收集公开信息。但是,它被编程为排除付费墙后的内容、涉及个人身份信息的来源dent违反OpenAI既定政策的文本。值得注意的是,网站所有者可以通过在其服务器上的标准文件中插入“disallow”命令来阻止GPTBot的抓取活动。
重磅消息🚨
— Shubham Saboo (@Saboo_Shubham_) 2023年8月7日
OpenAI刚刚发布了GPTBot,这是一款网络爬虫,旨在自动matic整个互联网的数据。
这些数据将用于训练未来的AI模型,例如GPT-4和GPT-5!
GPTBot会确保排除侵犯隐私和需要付费才能访问的内容。pic.twitter.com /oR3kY4buaU
这项新的网络爬虫项目紧随OpenAI近期提交的“GPT-5”商标申请之后。“GPT-5”预计将是现有GPT-4模型的继任者。该申请于7月18日提交至美国专利商标局,涵盖了“GPT-5”一词在各种 人工智能 应用中的使用,包括文本和语音转换、音频到文本的翻译以及语音识别。
OpenAI 的下一代模型计划
然而,尽管人们对GPT-5充满期待,OpenAI的创始人兼首席执行官Sam Altman却谨慎地表示,该公司距离正式开始GPT-5训练还有相当长的一段时间。他强调,在启动训练过程之前,需要进行全面的安全审计。.
商标申请,
— YK aka CS Dojo 📺🐦 (@ykdojo) 2023年8月1日
“GPT-5”
其中包括用于以下用途的软件
“人工生成人类语音和文本”
“将音频数据文件转换为文本”
、“语音识别”和
“基于机器学习的语言和语音处理”
👀 pic.twitter.com/54aJBovDNB
与此同时,OpenAI的数据收集做法,尤其是版权和用户许可问题,引发了越来越多的担忧。今年6月,日本隐私监管机构就 OpenAI 未经授权收集敏感数据一事向其发出警告。意大利也以违反欧盟隐私法为由,暂时禁止使用ChatGPT。这些事件凸显了数据隐私和人工智能技术正受到越来越多的关注。
值得注意的是,OpenAI 近期面临一起由 16 名原告提起的集体诉讼,原告声称该公司获取了用户与 ChatGPT 互动中的私人信息。该诉讼还将微软列为被告,并指出如果指控属实,两家公司都可能被认定违反了《计算机欺诈和滥用法案》(Computer Fraud and Abuse Act),该法案历来适用于网络爬虫案件。.
随着 OpenAI 利用 GPTBot 进军网络爬虫领域,它为改进其人工智能模型开辟了新的可能性。然而,这些发展也伴随着法律和伦理方面的考量,因为人工智能行业正在努力寻求创新、隐私和负责任的数据使用之间的微妙平衡。.
OpenAI