A colaboração do Spotify com a OpenAI permitirá que podcasters sintetizem sua própria voz para criar automaticamente versões de seus programas em idiomas estrangeiros. Essa é a ideia por trás do novo recurso de tradução de voz com tecnologia de IA do Spotify, que reproduz podcasts em outros idiomas usando a voz sintetizada do criador. Agora um podcaster pode simplesmente “apertar um botão” e falar outro idioma instantaneamente.
A empresa já assinou contrato com vários podcasters para traduzir seus episódios em inglês para o espanhol usando sua nova ferramenta e planeja lançar traduções em francês e alemão nas próximas semanas. Os primeiros episódios a serem traduzidos serão de podcasters de grandes nomes como Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett. O Spotify planeja expandir ainda mais este grupo para incluir The Rewatchables e o próximo show de Trevor Noah.
A base da função de tradução é a ferramenta de síntese de voz AI OpenAI Whisper, que pode transcrever a fala em inglês e traduzir para o inglês de outros idiomas. Mas a ferramenta do Spotify vai além da tradução de fala para texto – esse recurso traduzirá um podcast para outro idioma e o reproduzirá em uma versão sintetizada na voz do podcaster.
«Ao reunir a voz do próprio criador, o Voice Translation oferece aos ouvintes de todo o mundo a oportunidade de descobrir e se inspirar em novos podcasters de uma forma mais autêntica do que nunca”, disse Ziad Sultan, vice-presidente de Personalização do Spotify.
A OpenAI anunciou esta manhã o lançamento de uma ferramenta que pode criar “áudio semelhante ao humano a partir de apenas texto e alguns segundos de amostra de fala”. A disponibilidade da nova ferramenta será significativamente limitada devido a questões de segurança e privacidade. Esta é provavelmente uma das razões pelas quais a tecnologia de tradução do Spotify está atualmente sendo testada apenas com um “grupo seleto” de podcasters, e a empresa não fez previsões sobre a adoção em massa do novo recurso.