Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

OpenAI disponibilizou a voz hiper-realista do ChatGPT para alguns usuários pagos

A OpenAI começou a implantar a interface de voz Advanced Voice Mode para o serviço ChatGPT – um pequeno número de assinantes do ChatGPT Plus recebeu acesso a diálogos hiper-realistas com GPT-4o. O desenvolvedor prometeu que até o outono todos os titulares de uma assinatura paga poderão usar o novo recurso.

Fonte da imagem: Mariia Shalabaieva / unsplash.com

A OpenAI demonstrou pela primeira vez o formato de voz GPT-4o em maio, quando o recurso surpreendeu o público não apenas pela capacidade de fornecer respostas rápidas, mas também pela semelhança de uma das vozes com a voz de Scarlett Johansson. A atriz disse que negou ao chefe da empresa, Sam Altman, o direito de usar sua voz para esses fins; depois disso, ela teve que recorrer a advogados para proteger seus interesses, e a OpenAI abandonou suas intenções para não levar o assunto a um conflito. Em junho, a empresa informou que atrasaria o lançamento da interface de voz para finalizar as medidas de segurança.

Os recursos do assistente de IA anunciados anteriormente, como suporte de vídeo e compartilhamento de tela, não estarão disponíveis durante a fase de testes alfa, mas aparecerão “mais tarde”. Por enquanto, os usuários terão que se limitar à interação por voz. Anteriormente, a OpenAI usava três modelos de IA para implementar esse recurso: um para converter voz em texto, um segundo (GPT-4) para realmente processar as solicitações e um terceiro para converter a resposta de texto do ChatGPT em voz. O GPT-4o atualizado é multimodal – resolve todos esses problemas de forma independente, garantindo latência mínima. O modelo também é capaz de reconhecer entonações emocionais na voz do usuário, determinando, por exemplo, tristeza ou excitação; também sabe quando uma pessoa está cantando;

Fonte da imagem: Growtika/unsplash.com

A OpenAI lançará gradualmente a interface de voz ChatGPT para monitorar de perto como ela é realmente usada. Os usuários incluídos no grupo de testes alfa receberão uma notificação por meio do aplicativo ChatGPT, seguida de um e-mail com instruções sobre como usar os novos recursos. Até o momento, os recursos de voz do GPT-4o foram testados por mais de cem membros do Red Team fechado, falando 45 idiomas.

O modo de voz do ChatGPT será limitado a quatro vozes: Juniper, Breeze, Cove e Ember, que foram criadas com a participação de atores. A empresa abandonou a voz de Sky, que foi comparada à de Scarlett Johansson. A OpenAI também disse que instalou filtros para bloquear solicitações de músicas e outros materiais que possam estar protegidos por direitos autorais, algo que resultou em ações judiciais de grandes editoras musicais para as startups Suno e Udio.

avalanche

Próximo Os criadores de Warhammer 40.000: Space Marine 2 explicaram porque estão atrasando o anúncio dos requisitos do sistema e confirmaram o modo offline »

Anterior « Nothing lançou o Phone (2a) Plus por US$ 399 com um chip Dimensity 7350 Plus exclusivo e uma câmera selfie de 50 megapixels

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

As ações da Micron caíram 30% desde meados do mês.

As ações da Micron Technology caíram mais 10% na primeira sessão de negociação desta semana,…

5 horas atrás

Consoles de jogos

Um entusiasta construiu um PlayStation compacto com entrada para microSD e HDMI que consome menos de 2 watts.

O entusiasta e vlogger Secret Hobbyist projetou e construiu uma placa-mãe para PlayStation, combinando os…

6 horas atrás

Desenvolvimento e fabricação de eletrônicos

A investigação sobre o roubo da tecnologia de 2nm da TSMC foi concluída; um ex-funcionário enfrenta 20 anos de prisão.

Um tribunal taiwanês marcou o dia 27 de abril para o veredicto em um dos…

7 horas atrás

Jogos

“Só está piorando”: Uma fonte interna revelou mais um jogo da seleção de abril da PS Plus, e os fãs não estão nada contentes.

Billbil-kun, um informante com reputação de vazar informações de forma confiável, do portal francês Dealabs,…

13 horas atrás

Jogos

Bethesda confirma a data de encerramento de The Elder Scrolls: Blades

A Bethesda Games Studios não está com pressa para abrir um novo capítulo na franquia…

14 horas atrás

Notícias da rede

A Microsoft inundou milhares de solicitações de pull do GitHub com anúncios de IA — agora todas elas contêm “conselhos” idênticos do Copilot.

A Microsoft prometeu recentemente reduzir o uso excessivo de recursos de IA no Windows 11,…

15 horas atrás