O ChatGPT aprimora sua experiência com recursos avançados de IA para voz, visão e muito mais

- A OpenAI introduz um recurso de voz para o ChatGPT, permitindo respostas de áudio com múltiplas personas.
- A empresa tem como alvo usuários que estão sempre em movimento e a concorrência de assistentes pessoais.
- Os usuários também podem enviar imagens e perguntas, ampliando as capacidades do ChatGPT.
Em uma atualização significativa, a startup de inteligência artificial (IA) OpenAI adicionou recursos inovadores de IA ao seu aplicativo ChatGPT, permitindo que o chatbot ouça e fale, além de analisar imagens. Nas próximas duas semanas, os usuários poderão escolher entre cinco personas distintas para o chatbot, como "Juniper", "Breeze" e "Ember", cada uma oferecendo uma voz única para respostas de áudio. Este desenvolvimento representa o mais recente esforço da OpenAI para tornar as conversas com chatbots com IA ainda mais realistas e envolventes, atendendo aos assinantes do serviço ChatGPT Plus e usuários corporativos.
As conversas com chatbots de IA estão se tornando mais humanas.
O ChatGPT da OpenAI, lançado inicialmente em maio, já permitia interações de voz para texto com o chatbot. Agora, os usuários poderão selecionar uma personalidade de voz, tornando as conversas mais dinâmicas e naturais. Esse recurso de resposta em áudio visa aproximar a interação humana da IA, promovendo uma sensação de autenticidade nas conversas com o chatbot. A OpenAI espera que essa melhoriatracusuários que buscam assistência em qualquer lugar, colocando o ChatGPT em concorrência direta com assistentes pessoais já consolidados, como o Google Assistente, a Siri da Apple e a Alexa da Amazon.com.
Os usuários podem aproveitar esse recurso para diversas tarefas, como solicitar informações sobre a história da Disneylândia enquanto dirigem para o parque temático ou pedir uma receita de coquetel enquanto fazem outras coisas na cozinha. Durante os testes, o ChatGPT demonstrou suas capacidades de contar histórias narrando um conto fantasioso envolvendo uma estrela-do-mar e um nabo sueco. No entanto, vale ressaltar que, embora o ChatGPT possa gerar letras de músicas, ele não empresta sua voz para cantar, o que destaca as limitações do aplicativo no quesito performance vocal.
As vozes fornecidas pelo ChatGPT podem soar relativamente humanas, embora com um leve tom robótico. A OpenAI colaborou com atores de voz para desenvolver o modelo de IA de conversão de texto em fala que alimenta esse recurso, com o objetivo de proporcionar uma experiência de conversação mais envolvente e convincente.
Ampliando as capacidades com reconhecimento de imagem.
Além da atualização de voz, a OpenAI também anunciou novos recursos para o GPT-4, um dos modelos avançados de IA por trás do ChatGPT. Nas próximas semanas, usuários pagos e corporativos terão acesso a um recurso de reconhecimento de imagem no aplicativo e site do ChatGPT. Esse recurso permite que os usuários enviem uma imagem juntamente com uma pergunta ou solicitação relacionada, expandindo as capacidades do ChatGPT para além das interações baseadas em texto.
Por exemplo, os usuários podem enviar uma imagem de óculos de sol rosa e pedir ao chatbot conselhos de moda ou sugestões de looks que combinem com o acessório. Alternativamente, podem enviar a imagem de um problema matemático complexo e solicitar ajuda para resolvê-lo. Esse recurso de reconhecimento de imagem adiciona uma nova dimensão à utilidade do ChatGPT, ampliando sua versatilidade para usuários em diversos domínios. Essa melhoria representa um avanço significativo na integração entre IA baseada em texto e informações visuais, abrindo possibilidades interessantes para uma ampla gama de interações e aplicações com o usuário.
Comemorando os recursos aprimorados de IA do ChatGPT
As melhorias mais recentes da OpenAI no ChatGPT representam um avanço substancial na evolução contínua das baseadas em IA . A incorporação de proficiência vocal, com personas distintas, juntamente com a ampliação de suas capacidades para abranger a análise de imagens, demonstra o compromisso da OpenAI em fornecer aos usuários um ambiente conversacional profundamente envolvente e multifacetado. Embora ainda não esteja pronto para presentear os usuários com melodias cativantes, a capacidade do ChatGPT de participar de diálogos dinâmicos e extremamente realistas, além de responder com destreza a perguntas relacionadas a imagens, consolida firmemente sua posição como uma ferramenta de IA extremamente potente e indispensável no crescente campo dos assistentes virtuais e da inteligência artificial conversacional.
As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.
Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.
CURSO
- Quais criptomoedas podem te fazer ganhar dinheiro?
- Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
- Estratégias de investimento pouco conhecidas que os profissionais utilizam
- Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)















