ÚLTIMAS NOTÍCIAS

ZachXBT e o cofundador da BitMEX, Arthur Hayes, se enfrentam devido a uma acusação de "liquidez de saída"

Notícias de 6 de junho de 2026
A Twenty One Capital recupera a composição completa do comitê de auditoria, enquanto a Tether nomeia um diretordent

Notícias de 6 de junho de 2026
Huasheng restringe clientes da China continental à medida que a repressão às corretoras chinesas se espalha

Notícias de 6 de junho de 2026
A carteira vinculada ao fundador do Ethereum volta a funcionar e movimenta US$ 121 milhões em ETH

Notícias de 6 de junho de 2026

SELECIONADO PARA VOCÊ

Robô humanoide chuta criança na barriga durante demonstração na China

6 de junho de 2026 Tecnologia
Japão alerta para o risco de se tornar uma "colônia de IA" devido a polêmica sobre lei de dados

6 de junho de 2026 Tecnologia
O novo robô Proteus da Amazon recebe comandos de voz e percorre os armazéns

6 de junho de 2026 Tecnologia

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

OpenAI apresenta o GPTBot Web Crawler com controles de privacidade

Por

João Palmer

Tempo de leitura: 2 minutos - 7 de agosto de 2023

A OpenAI apresenta o GPTBot, um rastreador web com controles de privacidade para administradores de sites.
O GPTBot permite medidas proativas de exclusão para proteger a privacidade e a precisão dos dados.
O compromisso da OpenAI com o avanço responsável da IA por meio de maior privacidade de dados.

A OpenAI lançou discretamente o GPTBot, um rastreador web dedicado projetado para coletar dados para seus modelos de IA. No entanto, os administradores de sites agora podem impedir que o rastreador colete informações. Essa medida visa aprimorar a privacidade dos dados e a precisão dos modelos de IA da OpenAI. A empresa adicionou instruções para desativar o processo de rastreamento em sua documentação online, embora nenhum anúncio oficial tenha sido feito ainda.

O GPTBot da OpenAI pode serdentpelo token do agente do usuário 'GPTBot' na string do agente do usuário. Para impedir que o rastreador acesse determinadas partes de um site, os administradores podem adicioná-lo ao arquivo robots.txt do site, de forma semelhante à restrição de acesso do Googlebot a certas áreas. A OpenAI também divulgou o bloco de endereços IP usado pelo rastreador, permitindo que os administradores bloqueiem o acesso diretamente desses endereços.

A medida proativa de exclusão exigida

Para impedir que o GPTBot rastreie um site, os administradores precisam adicioná-lo proativamente ao arquivo robots.txt. Caso contrário, os dados coletados poderão ser usados em futuros modelos de IA, a menos que sejam explicitamente bloqueados. Essa abordagem permite que os proprietários de sites controlem seus dados e limitem o acesso da OpenAI.

Embora alguns especulem que a medida da OpenAI possa ter como objetivo se preparar para uma possível regulamentação contra a extração de dados ou se defender de ações futuras, não se sabe ao certo se os dados coletados anteriormente estariam isentos de análise. O GPT-4 da OpenAI, lançado em março de 2023, é baseado em dados coletados até setembro de 2021, o que podetraca atenção dos órgãos reguladores.

Otimizar respostas e garantir a precisão dos dados

A capacidade de detectar o GPTBot oferece aos proprietários de sites oportunidades que vão além do bloqueio de acesso. Uma sugestão é fornecer respostas diferentes ao OpenAI assim que o rastreador fordent. Essa abordagem permite que os administradores introduzam desinformação deliberadamente, influenciando a precisão dos conjuntos de dados de treinamento.

A OpenAI pretende usar o GPTBot para aprimorar seus modelos de IA, melhorando a precisão, as capacidades e a segurança. Como grandes modelos de linguagem como o GPT-3.5 e o GPT-4 dependem de extensos conjuntos de dados de treinamento, rastreadores da web como o GPTBot tornam-se ferramentas essenciais para a coleta de dados, permitindo respostas precisas às consultas dos usuários.

O papel dos rastreadores da web na coleta de dados

Os rastreadores da web, como o GPTBot, percorremmatica internet, coletando dados para diversos fins, incluindo indexação em mecanismos de busca e arquivamento de páginas da web. Seguindo as instruções no arquivo robots.txt, os proprietários de sites podem especificar quais áreas de seus sites podem ser rastreadas, protegendo dados sensíveis ou privados.

Uso anterior de conjuntos de dados pela OpenAI e a finalidade do GPTBot

A OpenAI já utilizou conjuntos de dados, incluindo o Common Crawl, para treinar seus modelos de IA. No entanto, o GPTBot é um rastreador dedicado, projetado para coletar dados especificamente para os modelos da OpenAI. Seu objetivo é ajudar a melhorar a precisão e a segurança das respostas geradas por IA.

O lançamento do GPTBot pela OpenAI, um rastreador web dedicado, oferece o benefício adicional de controles de privacidade para administradores de sites. A OpenAI visa aprimorar a privacidade e a precisão dos dados em seus modelos de IA, permitindo que os proprietários de sites optem por não participar da coleta de dados. Embora ainda haja especulações sobre as motivações da empresa, a iniciativa demonstra o compromisso da OpenAI em promover as capacidades de IA de forma responsável. Com os administradores de sites agora capacitados para direcionar o acesso do GPTBot, eles podem controlar melhor seus dados e garantir a precisão das respostas geradas pela IA.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

João Palmer

John Murangiri chegou à Cryptopolitan com habilidades em análise de mercado. John (também conhecido como JP) se formou na Universidade de Nairobi com bacharelado em comunicação social e estudos de mídia. Ele já contribuiu com análises do mercado de criptomoedas para o InsideBitcoins.com e o Metacoingraph.

ÍNDICE

1. A medida proativa de exclusão exigida

2. Otimizar respostas e garantir a precisão dos dados

3. O papel dos rastreadores da web na coleta de dados

4. Uso anterior de conjuntos de dados pela OpenAI e a finalidade do GPTBot

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, John Palmer, da área de tecnologia

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, John Palmer, da área de tecnologia

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, Aamir Sheikh, da área de tecnologia

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

CURSO INTENSIVO DE CRIPTOMOEDAS AVANÇADAS

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)