A OpenAI adiou o lançamento do novo recurso de modo de voz, alegando motivos de segurança. A empresa planeja realizar mais testes de segurança no recurso antes de disponibilizá-lo aos usuários. A empresa revelou o recurso no mês passado.
Leia também: Coinbase doa US$ 25 milhões para apoiar as eleições contra políticos anti-criptomoedas
O modo de voz gerou controvérsia por ser preocupantemente realista e supostamente por usar a voz de Scarlett Johansson para desenvolver uma voz que refletisse sua personagem no filme Ela A empresa demonstrou pela primeira vez o recurso de voz expressiva para o ChatGPT em maio. Também mostrou que o sistema conseguia ler expressões faciais e participar de conversas animadas em tempo real. A empresa de IA planejava lançar o recurso de voz em um teste alfa para um grupo seleto de usuários do ChatGPT Plus até junho.
Apresentamos o GPT-4o, nosso novo modelo principal capaz de raciocinar em áudio, visão e texto em tempo real: https://t.co/MYHZB79UqN
A entrada de texto e imagem está sendo implementada hoje na API e no ChatGPT, com voz e vídeo nas próximas semanas. pic.twitter.com/uuthKZyzYx
– OpenAI (@OpenAI) 13 de maio de 2024
A OpenAI revela os motivos do atraso
A empresa afirmou que o recurso de voz precisava de um mês extra para aprimorar seu funcionamento antes de ser lançado para todos os membros Plus no outono. O recurso de voz foi talvez o maior anúncio do evento de lançamento, apresentado juntamente com o ChatGPT-40 – o mais recente recurso de modelo de linguagem de grande porte. Funcionários da OpenAI demonstraram o modo de voz, participando de conversas com som natural.
Na época do anúncio, a empresa declarou: “O Modo de Voz avançado do ChatGPT consegue entender e responder com emoções e sinais não verbais, aproximando-nos de conversas naturais e em tempo real com IA. Nossa missão é trazer essas novas experiências para você de forma atenciosa.”
A apresentação gerou comparações entre o modo de voz e o filme de ficção científica Ela processar a OpenAI por usar uma voz semelhante à sua no filme. A empresa acabou declarando que removeria a voz de seu catálogo. Aparentemente, essa ameaça legal pode ter sido um dos motivos para o adiamento do lançamento.
Estamos compartilhando uma atualização sobre o Modo de Voz avançado que demonstramos durante nossa Atualização de Primavera, e que continua nos deixando muito animados:
Tínhamos planejado começar a disponibilizar isso em versão alfa para um pequeno grupo de usuários do ChatGPT Plus no final de junho, mas precisamos de mais um mês para atingirmos nossa meta para o lançamento
– OpenAI (@OpenAI) 25 de junho de 2024
A empresa de IA declarou vários motivos para o adiamento do lançamento, um dos quais é aprimorar a experiência do usuário, garantindo que o recurso possa detectar e recusar o acesso a determinadas conversas. A OpenAI também afirma que está preparando sua infraestrutura para gerenciar os milhões de membros que pretendem usar o novo recurso de voz.
“Por exemplo, estamos aprimorando a capacidade do modelo de detectar e rejeitar determinados conteúdos”, disse a OpenAI.
Usuários do ChatGPT expressam sua insatisfação
Uma parcela dos usuários do ChatGPT Plus questionou o valor de sua assinatura premium, pois não conseguiram enjdos recursos prometidos. Alguns críticos rapidamente apontaram o histórico da empresa de prometer demais e não cumprir suas promessas.
De fato, alguns membros do ChatGPT Plus sugeriram que este é o melhor momento para encerrar sua assinatura premium. Outro usuário revelou que optou por cancelar sua assinatura. Alguns observadores da comunidade de IA acreditam que o modo de voz poderá estar disponível em alguns meses.
Reportagem Cryptopolitan por Collins J. Okoth

