ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

O que o GPT-4o da OpenAI pode fazer?

PorIbiam WayasIbiam Wayas
Tempo de leitura: 2 minutos
O que o GPT-4o da OpenAI pode fazer?
  • O modelo mais recente da OpenAI, o ChatGPT-4o, "parece uma inteligência artificial de filme"
  • Ele pode aceitar e retornar solicitações em qualquer combinação de texto, áudio e imagem.
  • Responde com uma voz mais empática do que um modelo típico de IA.

Na segunda-feira, a OpenAI revelou seu mais recente modelo principal, chamado GPT-4o ("o" de "omni"), e aparentemente é o mais próximo que já chegamos de ter um assistente inteligente como o "Jarvis" do filme Homem de Ferro. 

O grande diferencial é que o ChatGPT-4o consegue lidar com diferentes modalidades, algo que a maioria dos modelos de IA existentes não consegue. Isso significa que o GPT-4o pode aceitar e gerar qualquer combinação de solicitações de texto, áudio e imagem.

A demonstração apresentada pela equipe no X (antigo Twitter) foi tão impressionante que gerou grande expectativa. Um dos grandes feitos do GPT-4o é sua capacidade de responder a comandos de áudio em apenas 232 milissegundos, um tempo de resposta semelhante ao de um ser humano durante uma conversa.

“Parece inteligência artificial de filme; e ainda me surpreende um pouco que seja real”, escreveu Sam Altman, CEO da OpenAI, em uma postagem no blog na segunda-feira. “Alcançar tempos de resposta e expressividade comparáveis ​​aos humanos acaba sendo uma grande mudança.”

A OpenAI começou a disponibilizar os recursos de texto e imagem do GPT-4o para os usuários. Nas próximas semanas, os recursos de áudio e vídeo serão liberados para "um pequeno grupo de parceiros confiáveis ​​na API", afirmou a empresa. 

Não obstante, aqui estão algumas das coisas que você pode fazer com o modelo ChatGPT-4o. 

Coisas que você pode fazer com o GPT-40

Crie imagens com textos legíveis

Até agora, alguns geradores de imagens com IA, como o Midjourney, ainda têm dificuldades para criar imagens com textos legíveis. A OpenAI afirmou que o GPT-40 agora entende descrições de texto muito melhor e consegue gerar textos legíveis em imagens. 

Fonte da imagem: OpenAI

Tradução em tempo real

Em situações que exigem um tradutor, o GPT-4o pode atuar como tal. Em uma demonstração em vídeo, a equipe da OpenAI mostrou que o GPT-4o consegue repetir algo dito em inglês em espanhol, e possivelmente em outros idiomas, e vice-versa.

Olhe e conte

Para pessoas com deficiência visual, ou simplesmente por diversão, o ChatGPT-4o consegue observar e descrever o que está acontecendo ao seu redor através da câmera do celular. Em um caso, o modelo foi capaz de identificar uma festa de aniversário ao detectar um cake e uma vela no ambiente.

Resolver problemas de matemática

O GPT-40 também consegue analisar problemas matemáticos em uma folha de papel ou tela e fornecer as respostas. Além disso, ele pode te dar aulas particulares e te guiar no aprendizado da resolução dos problemas.

IA em reuniões visuais

O GPT-4o pode participar de reuniões virtuais e manter conversas com os participantes. Ele também pode ajudar os usuários a se prepararem para entrevistas de emprego. 

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrondentdentdentdentdentdentdentdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO