Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

A inteligência artificial Voice Engine da OpenAI lerá o texto em sua voz

A OpenAI apresentou os resultados dos testes preliminares do modelo Voice Engine AI, que, com base em uma amostra de 15 segundos, pode expressar de forma realista o texto inserido, tentando transmitir com precisão as características de voz e fala do locutor.

Fonte da imagem: Unsplash, Igor Omilaev

Os primeiros desenvolvimentos do Voice Engine surgiram no final de 2022 e foram utilizados na API de conversão de texto em fala, bem como em conjunto com ChatGPT Voice e Read Aloud. A OpenAI está ciente das consequências do possível uso indevido da tecnologia de voz sintetizada, por isso espera obter feedback do público sobre possíveis perigos e áreas de aplicação. Quanto a este último, desde o ano passado a OpenAI se ofereceu para testar o Voice Engine com um pequeno grupo de parceiros – e recebeu exemplos de uso:

Ajudando leitores e crianças com dificuldades por meio de vozes naturais, emocionais e diversas. Por exemplo, a empresa de tecnologia educacional Age of Learning utiliza o Voice Engine para dar voz ao conteúdo e, junto com o GPT-4, fornecer respostas personalizadas aos alunos em tempo real.
A tradução de conteúdos como vídeos e podcasts permitirá que autores e empresas expandam seu público em todo o mundo, comunicando informações em suas próprias vozes e nas vozes dos funcionários. Um dos pioneiros é o HeyGen, uma plataforma de narrativa visual de IA para clientes corporativos, projetada para criar avatares humanóides para fins que vão desde marketing de produtos até discursos de vendas. O Voice Engine preserva o sotaque nativo do falante, portanto, quando um falante de francês falar um texto em inglês, um sotaque francês será ouvido.
Apoio a pessoas com problemas de fala, aplicações terapêuticas, suplementos educativos. Livox é um aplicativo de IA para dispositivos de comunicação alternativos e aumentados que ajuda pessoas com problemas de comunicação. Usando o Voice Engine, o Livox oferecerá vozes exclusivas e não robóticas para silenciar as pessoas. O usuário poderá escolher a voz que mais lhe convier, que falará em diferentes idiomas.
Ajuda na restauração da voz em casos de distúrbios súbitos e degenerativos da fala. O Norman Prince Neuroscience Institute (NPNI) está conduzindo um programa para ajudar pessoas com câncer ou distúrbios neurológicos da fala. Usando a capacidade do Voice Engine de reproduzir a fala em amostras de 15 segundos, os Drs. Fatima Mirza, Rohaid Ali e Konstantina Svokos usaram o áudio de um vídeo para um projeto escolar e restauraram a voz de um jovem paciente com problemas de fala devido a um tumor cerebral vascular.

Os parceiros da OpenAI concordaram com as regras de uso da tecnologia, que proíbem seu uso para se passar por outra pessoa, o que não se pode dizer de possíveis invasores que utilizam cada vez mais tecnologias de redes neurais para fins criminosos.

avalanche

Próximo Tesla informou sobre o lançamento de seu sexto milhão de carro elétrico »

Anterior « A Samsung foi a culpada pelo atraso do iPad Pro com telas OLED

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Carros, motos, veículos

A Tesla ultrapassou a BYD em remessas de veículos elétricos pela primeira vez desde o final de 2024.

O poder das montadoras chinesas parecia confirmado pela ascensão da BYD como a maior fornecedora…

35 minutos atrás

Jogos

Darkest Dungeon: Ascenders: Beyond the Peak, um implacável jogo de estratégia por turnos sobre alpinistas, foi anunciado.

Os desenvolvedores do estúdio francês Ludogram, com o apoio da editora Twin Sails Interactive, lançaram…

35 minutos atrás

Programas

O Google atualizou seu editor de vídeos Vids com os modelos de IA mais recentes da Veo e da Lyria, e adicionou avatares controlados por IA.

O Google continua a desenvolver ativamente seu editor de vídeo proprietário, o Vids. Desta vez,…

1 hora atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O Rowhammer foi adaptado para invadir computadores através de placas de vídeo – foram desenvolvidos exploits para GDDRHammer e GeForge.

Dois grupos de cientistas desenvolveram independentemente os conceitos de ataque GDDRHammer e GeForge — um…

1 hora atrás

Na vanguarda da ciência

A primeira telha solar do mundo com película de perovskita flexível e eficiência de 12,4% foi desenvolvida na Holanda.

A primeira telha solar do mundo feita com películas finas de perovskita foi desenvolvida na…

2 horas atrás

Desenvolvimento e fabricação de eletrônicos

Fabricantes de vidro japoneses veem oportunidade de capitalizar o boom da IA

Toda crise apresenta oportunidades para os participantes do mercado. A escassez de componentes para infraestrutura…