Inteligência Artificial

Modo avançado de conversa por voz no ChatGPT será lançado para assinantes

O recurso, que torna a interação com o ChatGPT mais natural, será disponibilizado para clientes dos planos Plus e Teams nesta semana

André Lopes
André Lopes

Repórter

Publicado em 24 de setembro de 2024 às 15h41.

Última atualização em 24 de setembro de 2024 às 15h49.

A OpenAI começou a liberar o Advanced Voice Mode (AVM), uma função que torna a interação com o ChatGPT mais próxima de uma conversa natural, para assinantes dos planos Plus e Teams do aplicativo até o fim de semana. Clientes corporativos e do setor educacional devem receber o recurso a partir da próxima semana. A mudança faz parte de uma expansão gradual da empresa para melhorar a usabilidade do chatbot por meio de áudio.

A principal novidade no lançamento é o design atualizado do AVM, agora representado por uma esfera azul animada, em vez dos pontos pretos exibidos no anúncio anterior da OpenAI em maio. Usuários que receberem o recurso verão um pop-up ao lado do ícone de voz no aplicativo do ChatGPT.

Além disso, o ChatGPT ganhou cinco novas vozes para experimentação: Arbor, Maple, Sol, Spruce e Vale. Isso eleva o total de vozes disponíveis para nove, incluindo Breeze, Juniper, Cove e Ember. Todas as vozes têm nomes inspirados na natureza, alinhando-se ao propósito do AVM de tornar a comunicação com o chatbot mais “natural”.

Uma ausência notável no catálogo é a voz Sky, que havia sido exibida no update de primavera da OpenAI, mas foi removida após uma disputa legal com a atriz Scarlett Johansson. A atriz alegou que a voz de Sky lembrava muito a sua própria, especialmente pelo papel dela como um sistema de IA no filme "Ela". A OpenAI negou qualquer intenção de imitar a voz da atriz, mas retirou a voz do ar após a reclamação.

Expansão de recursos e melhorias de desempenho

Outra ausência significativa neste lançamento é a função de compartilhamento de tela e vídeo, que havia sido apresentada pela OpenAI na primavera. Esse recurso permitiria que o ChatGPT processasse informações visuais e auditivas simultaneamente, como responder a perguntas em tempo real sobre um código ou equações exibidas na tela. A OpenAI não forneceu uma nova previsão para o lançamento dessas capacidades multimodais.

Ainda assim, melhorias foram feitas desde o teste limitado do AVM. A OpenAI afirma que o ChatGPT agora entende melhor diferentes sotaques, e as conversas são mais rápidas e fluidas. Em nossos testes anteriores, alguns bugs foram comuns, mas a empresa garante que esses problemas foram reduzidos.

Além disso, o AVM integra as funções de Custom Instructions e Memory, que permitem personalizar as respostas do ChatGPT e armazenar conversas para uso futuro.

No entanto, a OpenAI informou que o AVM ainda não está disponível em regiões como a União Europeia, Reino Unido, Suíça, Islândia, Noruega e Liechtenstein.

Acompanhe tudo sobre:ChatGPTOpenAI

Mais de Inteligência Artificial

Google acelera esforços para acompanhar indústria de IA, mas traz preocupações sobre transparência

Seu próximo romance pode ser com uma IA

Gemini consegue aumento de tráfego, mas ainda está bem atrás do concorrente ChatGPT

"Companheiro IA": os planos da Microsoft para os próximos 50 anos, segundo Mustafa Suleyman