Your bank is using your money. You’re getting the scraps.WATCH FREE

OpenAI apresenta o GPTBot Web Crawler com controles de privacidade

Neste post:

  • A OpenAI apresenta o GPTBot, um rastreador web com controles de privacidade para administradores de sites.
  • O GPTBot permite medidas proativas de exclusão para proteger a privacidade e a precisão dos dados.
  • O compromisso da OpenAI com o avanço responsável da IA ​​por meio de maior privacidade de dados.

A OpenAI lançou discretamente o GPTBot, um rastreador web dedicado projetado para coletar dados para seus modelos de IA. No entanto, os administradores de sites agora podem impedir que o rastreador colete informações. Essa medida visa aprimorar a privacidade dos dados e a precisão dos modelos de IA da OpenAI. A empresa adicionou instruções para desativar o processo de rastreamento em sua documentação online, embora nenhum anúncio oficial tenha sido feito ainda.

O GPTBot da OpenAI pode serdentpelo token do agente do usuário 'GPTBot' na string do agente do usuário. Para impedir que o rastreador acesse determinadas partes de um site, os administradores podem adicioná-lo ao arquivo robots.txt do site, de forma semelhante à restrição de acesso do Googlebot a certas áreas. A OpenAI também divulgou o bloco de endereços IP usado pelo rastreador, permitindo que os administradores bloqueiem o acesso diretamente desses endereços.

A medida proativa de exclusão exigida

Para impedir que o GPTBot rastreie um site, os administradores precisam adicioná-lo proativamente ao arquivo robots.txt. Caso contrário, os dados coletados poderão ser usados ​​em futuros modelos de IA, a menos que sejam explicitamente bloqueados. Essa abordagem permite que os proprietários de sites controlem seus dados e limitem o acesso da OpenAI.

Embora alguns especulem que a medida da OpenAI possa ter como objetivo se preparar para uma possível regulamentação contra a extração de dados ou se defender de ações futuras, não se sabe ao certo se os dados coletados anteriormente estariam isentos de análise. O GPT-4 da OpenAI, lançado em março de 2023, é baseado em dados coletados até setembro de 2021, o que podetraca atenção dos órgãos reguladores.

Veja também:  Trump pretende emitir decretos executivos para derrotar a China na corrida armamentista tecnológica global.

Otimizar respostas e garantir a precisão dos dados

A capacidade de detectar o GPTBot oferece aos proprietários de sites oportunidades que vão além do bloqueio de acesso. Uma sugestão é fornecer respostas diferentes ao OpenAI assim que o rastreador fordent. Essa abordagem permite que os administradores introduzam desinformação deliberadamente, influenciando a precisão dos conjuntos de dados de treinamento.

A OpenAI pretende usar o GPTBot para aprimorar seus modelos de IA, melhorando a precisão, as capacidades e a segurança. Como grandes modelos de linguagem como o GPT-3.5 e o GPT-4 dependem de extensos conjuntos de dados de treinamento, rastreadores da web como o GPTBot tornam-se ferramentas essenciais para a coleta de dados, permitindo respostas precisas às consultas dos usuários.

O papel dos rastreadores da web na coleta de dados

Os rastreadores da web, como o GPTBot, percorremmatica internet, coletando dados para diversos fins, incluindo indexação em mecanismos de busca e arquivamento de páginas da web. Seguindo as instruções no arquivo robots.txt, os proprietários de sites podem especificar quais áreas de seus sites podem ser rastreadas, protegendo dados sensíveis ou privados.

Uso anterior de conjuntos de dados pela OpenAI e a finalidade do GPTBot

A OpenAI já utilizou conjuntos de dados, incluindo o Common Crawl, para treinar seus modelos de IA. No entanto, o GPTBot é um rastreador dedicado, projetado para coletar dados especificamente para os modelos da OpenAI. Seu objetivo é ajudar a melhorar a precisão e a segurança das respostas geradas por IA.

O lançamento do GPTBot pela OpenAI, um rastreador web dedicado, oferece o benefício adicional de controles de privacidade para administradores de sites. A OpenAI visa aprimorar a privacidade e a precisão dos dados em seus modelos de IA, permitindo que os proprietários de sites optem por não participar da coleta de dados. Embora ainda haja especulações sobre as motivações da empresa, a iniciativa demonstra o compromisso da OpenAI em promover as capacidades de IA de forma responsável. Com os administradores de sites agora capacitados para direcionar o acesso do GPTBot, eles podem controlar melhor seus dados e garantir a precisão das respostas geradas pela IA.

Veja também:  Limitações de computação para treinamento de IA da Tesla são superadas, prometendo melhorias mais rápidas.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis .

Compartilhar link:

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. O Cryptopolitan não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamos tron a realização de pesquisas independentes dent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Mais lidas

Carregando os artigos mais lidos...

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Carregando artigos selecionados pela equipe editorial...

- A newsletter de criptomoedas que te mantém sempre um passo à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Assine o Cryptopolitan Daily e receba informações oportunas, precisas e relevantes sobre criptomoedas diretamente na sua caixa de entrada.

Inscreva-se agora e
não perca nenhum lance.

Entre. Informe-se.
Saia na frente.

Inscreva-se no CryptoPolitan