Inteligência Artificial

Modo avançado de conversa por voz no ChatGPT será lançado para assinantes

O recurso, que torna a interação com o ChatGPT mais natural, será disponibilizado para clientes dos planos Plus e Teams nesta semana

André Lopes
André Lopes

Repórter

Publicado em 24 de setembro de 2024 às 15h41.

Última atualização em 24 de setembro de 2024 às 15h49.

A OpenAI começou a liberar o Advanced Voice Mode (AVM), uma função que torna a interação com o ChatGPT mais próxima de uma conversa natural, para assinantes dos planos Plus e Teams do aplicativo até o fim de semana. Clientes corporativos e do setor educacional devem receber o recurso a partir da próxima semana. A mudança faz parte de uma expansão gradual da empresa para melhorar a usabilidade do chatbot por meio de áudio.

A principal novidade no lançamento é o design atualizado do AVM, agora representado por uma esfera azul animada, em vez dos pontos pretos exibidos no anúncio anterior da OpenAI em maio. Usuários que receberem o recurso verão um pop-up ao lado do ícone de voz no aplicativo do ChatGPT.

Além disso, o ChatGPT ganhou cinco novas vozes para experimentação: Arbor, Maple, Sol, Spruce e Vale. Isso eleva o total de vozes disponíveis para nove, incluindo Breeze, Juniper, Cove e Ember. Todas as vozes têm nomes inspirados na natureza, alinhando-se ao propósito do AVM de tornar a comunicação com o chatbot mais “natural”.

Uma ausência notável no catálogo é a voz Sky, que havia sido exibida no update de primavera da OpenAI, mas foi removida após uma disputa legal com a atriz Scarlett Johansson. A atriz alegou que a voz de Sky lembrava muito a sua própria, especialmente pelo papel dela como um sistema de IA no filme "Ela". A OpenAI negou qualquer intenção de imitar a voz da atriz, mas retirou a voz do ar após a reclamação.

Expansão de recursos e melhorias de desempenho

Outra ausência significativa neste lançamento é a função de compartilhamento de tela e vídeo, que havia sido apresentada pela OpenAI na primavera. Esse recurso permitiria que o ChatGPT processasse informações visuais e auditivas simultaneamente, como responder a perguntas em tempo real sobre um código ou equações exibidas na tela. A OpenAI não forneceu uma nova previsão para o lançamento dessas capacidades multimodais.

Ainda assim, melhorias foram feitas desde o teste limitado do AVM. A OpenAI afirma que o ChatGPT agora entende melhor diferentes sotaques, e as conversas são mais rápidas e fluidas. Em nossos testes anteriores, alguns bugs foram comuns, mas a empresa garante que esses problemas foram reduzidos.

Além disso, o AVM integra as funções de Custom Instructions e Memory, que permitem personalizar as respostas do ChatGPT e armazenar conversas para uso futuro.

No entanto, a OpenAI informou que o AVM ainda não está disponível em regiões como a União Europeia, Reino Unido, Suíça, Islândia, Noruega e Liechtenstein.

Acompanhe tudo sobre:ChatGPTOpenAI

Mais de Inteligência Artificial

Com 120 projetos de IA, Cogna aposta que tecnologia trará mais receita do que redução de custos

Os quatro setores nos quais a IA irá transformar o futuro da humanidade, segundo o CEO do Google

Conheça o brasileiro que integra a cúpula de inteligência artificial em evento sobre o tema em Dubai

Regulação da IA terá novo texto e deve ser votada no Senado após eleições, diz relator