A OpenAI anunciou que seu modelo principal, o GPT-4.1, será implementado no ChatGPT. O modelo estará disponível para todas as contas pagas e usuários de equipe no menu suspenso de seleção de modelos. A OpenAI revelou que os usuários gratuitos estão excluídos da implementação, mas os usuários das contas Enterprise e Edu terão acesso.
O GPT-4.0 mini será substituído pelo GPT-4.1 mini para todos os usuários, incluindo contas gratuitas. Usuários com planos pagos também verão o modelo GPT-4.1 mini em seu menu suspenso.
Segundo a OpenAI, o GPT-4.1 mini e o GPT-4.1 são otimizados para tarefas de codificação e possuem resposta aprimorada a instruções, superando o GPT-4.0.
O GPT-4.1 da OpenAI supera o GPT-4.0 em todos os aspectos
Segundo a OpenAI, o modelo GPT-4.1 oferece uma janela de contexto maior, que suporta até um milhão de tokens de contexto e consegue utilizar melhor o contexto com compreensão de longo prazo. A empresa de IA acrescentou que os engenheiros de software se beneficiarão do uso do modelo para desenvolver aplicações web.
As notas de lançamento da OpenAI revelaram que os engenheiros podem usar o modelo para executar consultas diárias, perguntas de acompanhamento, programação e outras tarefas complexas.
A empresa de IA liderada por Sam Altman afirmou que o modelo GPT-4.1 consegue processar quantidades massivas de texto, imagens e vídeos no prompt, em comparação com o limite de 128.000 tokens do GPT-4.0. De acordo com a OpenAI , o GPT-4.1 obteve 54,6% de pontuação no SWE-bench Verified, representando uma melhoria de 21,4% em relação ao GPT-4.0 e de 26,6% em relação ao GPT-4.5, tornando-se o modelo líder para tarefas de programação.
No teste MultiChallenge da Scale, que mede a capacidade de seguir instruções, o GPT-4.1 obteve 38,3%, um aumento de 10,5% em relação ao GPT-4.0. Além disso, no Video MME, um teste para compreensão de contexto multimodal extenso, o GPT-4.1 alcançou uma pontuação muito alta de 72,0% na categoria de vídeos longos sem legendas, uma melhoria de 6,7% em relação ao GPT-4.0.
A OpenAI revelou que os benchmarks fornecem informações valiosas e que os modelos foram treinados com foco em aplicações do mundo real. A empresa expressou gratidão à comunidade de desenvolvedores por otimizar os modelos para tarefas complexas.
O GPT-4.1 não inclui um relatório de segurança
A comunidade de pesquisa em IA criticou a OpenAI por lançar o modelo GPT-4.1 sem o relatório de segurança, alegando que os padrões de transparência dos modelos da OpenAI foram reduzidos.
A empresa de IA argumentou que, apesar de oferecer desempenho e velocidade aprimorados em relação ao GPT-4.0, o modelo não exige relatórios de segurança como os modelos mais avançados, pois não é um modelo de vanguarda.
“O GPT-4.1 não introduz novas modalidades ou formas de interação com o modelo e não supera o GPT-03 em inteligência. Isso significa que as considerações de segurança aqui, embora substanciais, são diferentes dos modelos de vanguarda.”
– Johannes Heidecke , Chefe de Segurança da Open AI
A empresa de tecnologia de IA divulgou mais informações sobre o GPT-4.1 em resposta às alegações de segurança. Na quarta-feira, a empresa se comprometeu a publicar prontamente os resultados de suas avaliações internas de segurança do modelo, como parte de um esforço para aumentar a transparência.
A empresa revelou que está se esforçando para se destacar em um mercado cada vez mais competitivo. A empresa de IA está prestes a anunciar a aquisição da Windsurf por US$ 3 bilhões, uma das ferramentas de programação com IA mais conhecidas. A Windsurf compete com o Cursor, outra ferramenta popular de programação com IA, e com recursos de programação com IA já existentes de empresas como Microsoft e Anthropic.
Andrej Karpathy, ex-fundador da OpenAI, afirmou que o Windsurf é uma ferramenta que tem atraído desenvolvedores nos últimos meses para agilizar a criação de código para novos softwares. Entre os investidores da startup estão Founders Fund, General Catalyst, Greenoaks e Kleiner Perkins.
O Google, por outro lado, atualizou seu chatbot Gemini para se conectar mais facilmente a projetos do GitHub. A integração com o GitHub ocorre após a OpenAI lançar um conector do GitHub para do ChatGPT . A ferramenta de conexão com o GitHub pesquisa na web e em outras fontes para compilar um relatório de pesquisa completo sobre um tópico.
Na terça-feira, a OpenAI também deu as boas-vindas aos conectores do SharePoint e do Microsoft OneDrive à pesquisa aprofundada do ChatGPT.
Foto de Focal Foto via Flickr.