A OpenAI, renomada empresa de inteligência artificial, lançou recentemente sua mais nova ferramenta, o "GPTBot", projetada para rastreamento da web, o que pode abrir caminho para melhorias em futuras versões de seus modelos ChatGPT.
Em uma publicação recente em seu blog, a OpenAI anunciou o lançamento do GPTBot, destacando seu potencial para aprimorar as futuras versões do ChatGPT. A principal função da ferramenta gira em torno da coleta de dados na web, um processo no qual um robô, frequentemente chamado de spider da web, indexa o conteúdo de sites na vasta extensão da internet. Isso permite que mecanismos de busca como Google e Bing exibam sites relevantes em seus resultados de pesquisa.
A OpenAI explicou que o GPTBot foi projetado para coletar informações publicamente acessíveis de diversas fontes da web. No entanto, ele é programado para excluir conteúdo protegido por paywalls, fontes que contenham informações de identificação pessoaldenttextos que violem as políticas estabelecidas pela OpenAI. É importante ressaltar que os proprietários de sites podem impedir as atividades de rastreamento do GPTBot inserindo um comando "disallow" em um arquivo padrão em seus servidores.
Notícia urgente 🚨
-Shubham Saboo (@Saboo_Shubham_) 7 de agosto de 2023
A OpenAI acaba de lançar o GPTBot, um rastreador web projetado paramaticde toda a internet.
Esses dados serão usados para treinar futuros modelos de IA, como o GPT-4 e o GPT-5!
O GPTBot garante que fontes que violam a privacidade e aquelas atrás de paywalls sejam excluídas. pic.twitter.com/oR3kY4buaU
Essa nova iniciativa de rastreamento da web surge após o recente pedido de registro de marca da OpenAI para “GPT-5”, o sucessor projetado para o modelo GPT-4 existente. O pedido, protocolado no Escritório de Patentes e Marcas dos Estados Unidos em 18 de julho, abrange o uso do termo “GPT-5” para diversas baseadas em IA , incluindo conversão de texto e fala, tradução de áudio para texto e reconhecimento de voz.
A OpenAI planeja o próximo modelo
No entanto, apesar da expectativa em torno do GPT-5, o fundador e CEO da OpenAI, Sam Altman, alertou que a empresa ainda está longe de iniciar o treinamento do GPT-5. Ele enfatizou a necessidade de extensas auditorias de segurança antes de iniciar o processo de treinamento.
A OpenAI registrou um pedido de marca para:
— YK aka CS Dojo 📺🐦 (@ykdojo) 1º de agosto de 2023
“GPT-5”
, que inclui “software para”:
“produção artificial de fala e texto humanos”
, “conversão de arquivos de dados de áudio em texto”
, “reconhecimento de voz e fala”
, “processamento de linguagem e fala baseado em aprendizado de máquina”
👀 pic.twitter.com/54aJBovDNB
Entretanto, a OpenAI tem enfrentado crescentes preocupações em relação às suas práticas de coleta de dados, particularmente no que diz respeito a direitos autorais e questões de consentimento. Em junho, a autoridade de proteção de dados do Japão emitiu um alerta à OpenAI sobre a coleta de dados sensíveis sem a devida autorização. A Itália, de forma semelhante, impôs uma proibição temporária ao uso do ChatGPT, alegando violações das leis de privacidade da União Europeia. Esses casos evidenciam o crescente escrutínio em torno da privacidade de dados e da tecnologia de IA.
Notavelmente, a OpenAI enfrentou recentemente uma ação coletiva movida por 16 demandantes que alegaram que a empresa acessou informações privadas de interações de usuários com o ChatGPT. Essa ação, que também inclui a Microsoft como ré, argumenta que, se as alegações forem comprovadas, ambas as empresas podem ser consideradas culpadas de violar a Lei de Fraude e Abuso de Computadores (Computer Fraud and Abuse Act), uma estrutura legal que tem sido historicamente aplicada a casos de web scraping.
À medida que a OpenAI se aventura no campo da coleta de dados na web com o GPTBot, novas possibilidades se abrem para o aprimoramento de seus modelos de IA. No entanto, esses desenvolvimentos vêm acompanhados de considerações legais e éticas, enquanto a indústria de IA busca o delicado equilíbrio entre inovação, privacidade e uso responsável de dados.
OpenAI