A empresa de inteligência artificial OpenAI tomou a iniciativa de contra-atacar o modelo DeepSeek R1, anunciando o lançamento do seu o3-Mini. A empresa agiu rapidamente na sexta-feira, numa tentativa de responder diretamente ao modelo de IA da startup chinesa que tem dominado as conversas no mercado.
O modelo DeepSeek R1 tem sido aclamado como um modelo de IA de última geração, com relatos afirmando que ele produz respostas fantásticas, imitando o processo de pensamento humano. O modelo também reduz o uso de memória e é mais econômico do que outros concorrentes no mercado. Além de seu desempenho incrível, o desenvolvimento do modelo teria custado US$ 6 milhões, em comparação com o ChatGPT-4 da OpenAI, que custa cerca de US$ 100 milhões.
A OpenAI considera o3-Mini o modelo "mais econômico"
Com o modelo recente da DeepSeek sendo aclamado como o mais econômico do mercado, isso pode ter despertado o interesse da OpenAI, levando-a a agir. De acordo com uma publicação em seu blog, a empresa mencionou que o modelo o3-Mini é o "mais econômico" de sua série de modelos de raciocínio. "Estamos lançando o OpenAI o3-mini, o modelo mais novo e econômico de nossa série de modelos de raciocínio, disponível hoje tanto no ChatGPT quanto na API", diz a publicação .
Em seu comunicado, a empresa também divulgou algumas das capacidades do novo modelo, observando que ele amplia o que modelos menores podem alcançar. "Apresentado em dezembro de 2024, este modelo poderoso e rápido expande os limites do que modelos pequenos podem alcançar (...) mantendo o baixo custo e a latência reduzida do OpenAI o1-mini", acrescentou a OpenAI.
Segundo comunicado, a de inteligência artificial permitirá que os usuários enj gratuitamente, pela primeira vez, das capacidades de raciocínio dos modelos, enquanto os usuários pagos terão enj triplo do limite diário de mensagens, passando de 50 para 150. A empresa está oferecendo essa opção para impulsionar o uso da nova linha de modelos de raciocínio. O novo modelo, disponível nas versões baixa, média e alta, fornecerá aos usuários respostas mais precisas para inferências mais complexas.
A família de modelos de IA "o" da empresa concentra-se principalmente em tarefas de raciocínio. Isso significa que eles são menos criativos em comparação com os modelos da família GPT, mas incluem raciocínio baseado em cadeia de pensamento. Isso permite que eles resolvam problemas complexos, construam códigos com melhor estrutura etracanálises incorretas. Embora o novo modelo seja inferior ao o1-Mini em conhecimento geral e raciocínio multilíngue baseado em cadeia de pensamento, ele apresenta melhor desempenho em codificação, factualidade e em todos os outros testes de benchmark.
A descoberta da DeepSeek e seus efeitos
A inovação alcançada pela DeepSeek com seu modelo de IA, que apresentou resultados superiores ao modelo da OpenAI, causou certo alvoroço na indústria de tecnologia dos Estados Unidos. Além da repercussão, a inovação também reduziu o mercado de tecnologia americano em cerca de US$ 1 trilhão, com a Nvidia perdendo US$ 600 bilhões em valor de mercado. O desenvolvimento também colocou em xeque a demanda futura por seus caros chips de IA.
A diferença de eficiência decorre da abordagem inovadora adotada pela DeepSeek em sua arquitetura de modelos. Enquanto empresas de inteligência artificial nos EUA buscavam aumentar o poder computacional de seus modelos, a DeepSeek conseguiu otimizar o processamento de informações pelos modelos, resultando em maior eficiência. A pressão aumentou ainda mais quando a empresa chinesa de tecnologia Alibaba lançou o Qwen2.5 Max.
Enquanto isso, o o3-Mini busca ampliar essa vantagem, com um desempenho 24% superior ao do modelo anterior. Ele também se iguala a alguns modelos mais antigos e supera outros em benchmarks importantes. Embora seu preço seja bastante competitivo, é superior ao do DeepSeek R1. O o3-Mini custa US$ 0,55 por milhão de tokens de entrada e US$ 4,40 por milhão de tokens de saída, enquanto o DeepSeek custa US$ 0,14 e US$ 2,19, respectivamente, para os mesmos volumes.

