A OpenAI finalmente revelou o modelo de IA GPT 4.5, mas ele é menos capaz que os concorrentes em certas tarefas

Por

Shummas Humayun

Tempo de leitura: 4 minutos - 1 de março de 2025

A OpenAI finalmente revelou seu maior modelo de IA, o GPT-4.5, codinome 'Orion'.
O GPT-4.5 fica atrás de concorrentes como o Claude 3.7 Sonnet da Anthropic em tarefas acadêmicas.
Produz respostas mais quentes em comparação com 4o e o3-mini.

A OpenAI apresentou o GPT-4.5, codinome Orion, marcando o que a empresa considera seu maior modelo até o momento. Muitos na comunidade tecnológica aguardavam ansiosamente o próximo passo na série de modelos GPT, que já demonstraram avançosmatic em escrita, matemática, programação e outras áreas.

A estratégia da empresa para o GPT-4.5 tem sido a de lançá-lo em etapas. Os assinantes do plano ChatGPT Pro, que custa US$ 200 por mês, têm acesso imediato por meio de uma prévia para pesquisa. Os desenvolvedores que utilizam os planos pagos da API da OpenAI também podem acessar o GPT-4.5 imediatamente. Os clientes do ChatGPT Plus e do ChatGPT Team serão os próximos, e um porta-voz da OpenAI afirmou que o novo modelo deverá estar disponível para eles na próxima semana. De acordo com a OpenAI, o lançamento gradual se deve em parte à enorme demanda computacional por trás desse sistema "gigante".

Hoje estamos lançando uma prévia de pesquisa do GPT-4.5 — nosso maior e melhor modelo para bate-papo até o momento.

Disponível agora para todos os usuários do ChatGPT Pro, seguido pelos usuários do Plus e Team na próxima semana e, na semana seguinte, pelos usuários do Enterprise e Edu. pic.twitter.com/br5win5OEB
— OpenAI (@OpenAI) 27 de fevereiro de 2025

Nos círculos tecnológicos, a chegada do GPT-4.5 foi vista como um indicador de se os métodos tradicionais de treinamento — principalmente o aumento da quantidade de dados e recursos computacionais — continuariam a produzir ganhos significativos de desempenho. Até agora, a série GPT seguiu um padrão bastante previsível. Versões como GPT-1, GPT-2, GPT-3 e GPT-4 apresentaram saltos notáveis em capacidade sempre que a OpenAI aplicou mais poder computacional e forneceu mais dados de treinamento.

Em cada geração, os índices de desempenho emmatic, escrita, programação e outras categorias aumentarammatic. O GPT-4.5 pretende dar continuidade a essa tendência com o que a empresa descreve como "um conhecimento de mundo mais profundo" e "maior inteligência emocional". Mas, ao mesmo tempo, os resultados do GPT-4.5 em certos testes indicam que os ganhos obtidos simplesmente com o aumento da escalabilidade podem estar se estabilizando.

Características e limitações iniciais do GPT-4.5

A OpenAI ressalta que o GPT-4.5 não deve ser visto como um substituto direto para o GPT-40. O GPT-4.5 inclui funcionalidades avançadas, como suporte para upload de arquivos e imagens e a ferramenta de tela do ChatGPT para criações artísticas. No entanto, atualmente não oferece suporte ao modo de voz bidirecional do ChatGPT, introduzido recentemente.

As primeiras avaliações realizadas pela OpenAI e outros pesquisadores revelam que o GPT-4.5 supera o GPT-4o em diversas categorias de teste. Por exemplo, no benchmark SimpleQA — um teste projetado para medir a capacidade de um modelo responder a perguntas factuais diretas — o GPT-4.5 obteve pontuações de precisão mais altas do que o GPT-4o e também superou os modelos de raciocínio o1 e o3-mini da OpenAI. De acordo com a empresa, o GPT-4.5 "alucina" com menos frequência do que muitos outros sistemas, o que significa que ele é menos propenso a gerar conteúdo que diverge de informações reais.

Benchmarks SimpleQA do GPT-4.5. Fonte: OpenAI

Em avaliações de codificação, os resultados são mais mistos. No benchmark SWE-Bench Verified, o GPT-4.5 se equipara aproximadamente ao GPT-4o e ao o3-mini, mas não os supera. Isso coloca o GPT-4.5 abaixo tanto do modelo de pesquisa profunda da OpenAI quanto do Claude 3.7 Sonnet da Anthropic.

Benchmarks de eficiência de software (SWE) do GPT-4.5. Fonte: OpenAI

Em um teste de codificação diferente, conhecido como SWE-Lancer, o GPT-4.5 tem um desempenho melhor do que o GPT-4o e o3-mini, mas ainda fica atrás de pesquisas mais aprofundadas.

Benchmarks do GPT-4.5 SWE-Lancer. Fonte: OpenAI

O desempenho do GPT-4.5 também diverge em benchmarks acadêmicos desafiadores. No AIME e no GPQA, ele não alcança os resultados obtidos por modelos de ponta como o3-mini, R1 do DeepSeek ou Claude 3.7 Sonnet do Anthropic. No entanto, o GPT-4.5 iguala ou, às vezes, supera modelos líderes que não são classificados como sistemas de "raciocínio", evidenciando que o GPT-4.5 mantém sólidas capacidades em matemática e ciências.

A OpenAI também destacou os pontos fortes do GPT-4.5 em áreas menos quantificáveis. A empresa afirma que o GPT-4.5 consegue compreender melhor as intenções humanas e produzir respostas que parecem mais acolhedoras, naturais e socialmente conscientes.

Um teste informal consistia na seguinte pergunta: "Estou passando por um momento difícil depois de ter reprovado em uma prova". Embora os outros dois modelos tenham oferecido informações úteis, o GPT-4.5 demonstrou maior empatia e sensibilidade emocional.

“[Nós] esperamos obter uma visão mais completa das capacidades do GPT-4.5 por meio desta versão”, escreveu a OpenAI na postagem do blog, “porque reconhecemos que os benchmarks acadêmicos nem sempre refletem a utilidade no mundo real.”

O GPT-4.5 fornece respostas mais quentes do que o 4o e o3-mini. Fonte: OpenAI

Leis de escala sob escrutínio

O GPT-4.5 foi construído com a mesma estratégia de treinamento não supervisionado usada em versões anteriores do GPT, uma estratégia que até agora se mostrou confiável. No entanto, seu desempenho limitado em certos benchmarks de alto nível pode ser um sinal de que as "leis de escalabilidade" tradicionais da indústria podem estar perdendo força.

Ilya Sutskever, cofundador e ex-cientista-chefe da OpenAI, comentou em dezembro que "atingimos o pico de dados" e que "o pré-treinamento como o conhecemos chegará ao fim, sem dúvida". Na ocasião, ele insinuou que os ganhos futuros dependeriam de outros métodos, como sistemas capazes de raciocinar de forma mais profunda sobre os problemas, em vez de simplesmente memorizar grandes quantidades de informação.

Ilya Sutskever e Sam Altman na TAU. Fonte: TAUVOD no YouTube

O GPT-4.5 era aparentemente "incrivelmente caro de treinar", como mencionado em seu white paper, e rumores circularam por meses de que a OpenAI havia adiado o lançamento diversas vezes devido a problemas de desempenho e custo. Mesmo assim, o GPT-4.5 sozinho não parece superar modelos de raciocínio especializados de concorrentes em muitas tarefas avançadas. A própria empresa o considera mais um marco no desenvolvimento da tecnologia GPT, que combina com seus sistemas de raciocínio "o", uma integração que deve começar com o lançamento do GPT-5 ainda este ano.

Comentários do CEO Sam Altman sobre a escassez de GPUs

O CEO da OpenAI, Sam Altman, usou o X (antigo Twitter) para explicar por que o lançamento do modelo mais recente está acontecendo em fases. "Temos crescido muito e estamos sem GPUs", escreveu Altman, chamando o GPT-4.5 de "gigantesco" e "caro" e alertando que a empresa precisaria de "dezenas de milhares" de GPUs adicionais antes de disponibilizar o modelo para o restante da base de usuários.

O GPT-4.5 está pronto!

Boas notícias: é o primeiro modelo que me dá a sensação de estar conversando com uma pessoa atenciosa. Já me vi várias vezes sentado, surpreso por receber conselhos realmente bons de uma IA.

Más notícias: é um modelo enorme e caro. Nós…
— Sam Altman (@sama) 27 de fevereiro de 2025

Devido ao seu grande tamanho, o GPT-4.5 está se mostrando muito caro. A OpenAI cobra US$ 75 por milhão de tokens para a entrada e US$ 150 por milhão de tokens gerados pelo modelo. Isso representa um custo de entrada/saída 30 vezes maior e 15 vezes maior, respectivamente, em comparação com o modelo GPT-4.5.

Ele explicou melhor: “Adicionaremos dezenas de milhares de GPUs na próxima semana e as disponibilizaremos para o plano Plus em seguida… Não é assim que gostaríamos de operar, mas é difícil prever com perfeição picos de crescimento que levam à escassez de GPUs.”

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

OpenAI

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Shummas Humayun

Shummas é um ex-redator de conteúdo técnico e pesquisador.

ÍNDICE

1. Características e limitações iniciais do GPT-4.5

2. Leis de escala sob escrutínio

3. Comentários do CEO Sam Altman sobre a escassez de GPUs

Compartilhe este artigo