- O modelo mais recente da OpenAI, o ChatGPT-4o, "parece uma inteligência artificial de filme"
- Ele pode aceitar e retornar solicitações em qualquer combinação de texto, áudio e imagem.
- Responde com uma voz mais empática do que um modelo típico de IA.
Na segunda-feira, a OpenAI revelou seu mais recente modelo principal, chamado GPT-4o ("o" de "omni"), e aparentemente é o mais próximo que já chegamos de ter um assistente inteligente como o "Jarvis" do filme Homem de Ferro.
O grande diferencial é que o ChatGPT-4o consegue lidar com diferentes modalidades, algo que a maioria dos modelos de IA existentes não consegue. Isso significa que o GPT-4o pode aceitar e gerar qualquer combinação de solicitações de texto, áudio e imagem.
A demonstração apresentada pela equipe no X (antigo Twitter) foi tão impressionante que gerou grande expectativa. Um dos grandes feitos do GPT-4o é sua capacidade de responder a comandos de áudio em apenas 232 milissegundos, um tempo de resposta semelhante ao de um ser humano durante uma conversa.
“Parece inteligência artificial de filme; e ainda me surpreende um pouco que seja real”, escreveu Sam Altman, CEO da OpenAI, em uma postagem no blog na segunda-feira. “Alcançar tempos de resposta e expressividade comparáveis aos humanos acaba sendo uma grande mudança.”
A OpenAI começou a disponibilizar os recursos de texto e imagem do GPT-4o para os usuários. Nas próximas semanas, os recursos de áudio e vídeo serão liberados para "um pequeno grupo de parceiros confiáveis na API", afirmou a empresa.
Não obstante, aqui estão algumas das coisas que você pode fazer com o modelo ChatGPT-4o.
Coisas que você pode fazer com o GPT-40
Crie imagens com textos legíveis
Até agora, alguns geradores de imagens com IA, como o Midjourney, ainda têm dificuldades para criar imagens com textos legíveis. A OpenAI afirmou que o GPT-40 agora entende descrições de texto muito melhor e consegue gerar textos legíveis em imagens.

Tradução em tempo real
Em situações que exigem um tradutor, o GPT-4o pode atuar como tal. Em uma demonstração em vídeo, a equipe da OpenAI mostrou que o GPT-4o consegue repetir algo dito em inglês em espanhol, e possivelmente em outros idiomas, e vice-versa.
Olhe e conte
Para pessoas com deficiência visual, ou simplesmente por diversão, o ChatGPT-4o consegue observar e descrever o que está acontecendo ao seu redor através da câmera do celular. Em um caso, o modelo foi capaz de identificar uma festa de aniversário ao detectar um cake e uma vela no ambiente.
Resolver problemas de matemática
O GPT-40 também consegue analisar problemas matemáticos em uma folha de papel ou tela e fornecer as respostas. Além disso, ele pode te dar aulas particulares e te guiar no aprendizado da resolução dos problemas.
IA em reuniões visuais
O GPT-4o pode participar de reuniões virtuais e manter conversas com os participantes. Ele também pode ajudar os usuários a se prepararem para entrevistas de emprego.
Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)
















