Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

ChatGPT aprendeu a entender comandos de voz e trabalhar com imagens

OpenAI expandiu as opções de interação com ChatGPT. A nova versão do chatbot agora aceita não apenas texto, mas também imagens e comandos de voz como prompts. Para usuários comerciais, novos recursos estarão disponíveis nas próximas duas semanas, mas outros terão que esperar um pouco.

Fonte da imagem: The Verge

As conversas de voz com ChatGPT são um tanto semelhantes às conversas com qualquer assistente de voz, mas a OpenAI afirma que a qualidade das respostas é significativamente maior devido à tecnologia subjacente aprimorada. O usuário pressiona um botão e faz uma pergunta, o ChatGPT converte em texto e a alimenta em um modelo de linguagem maior, recebe a resposta, converte de volta em fala e fala a resposta em voz alta.

Os novos recursos do ChatGPT contam com o modelo maior de linguagem Whisper, que faz grande parte do trabalho de conversão de fala em texto e vice-versa. De acordo com a OpenAI, o novo modelo pode gerar “uma voz humana a partir de um texto e uma amostra de fala com alguns segundos de duração”. Existem atualmente cinco opções de voz ChatGPT disponíveis, mas a OpenAI vê muito mais potencial neste modelo.

A capacidade de criar uma voz sintetizada de qualquer pessoa com base em apenas alguns segundos de sua fala oferece um amplo campo de atividade para os cibercriminosos, admite a OpenAI no anúncio de novos recursos: “São novos riscos, como a capacidade dos invasores de personificar figuras públicas ou cometer fraude.” Segundo a empresa, o modelo não está disponível para uso generalizado por este motivo: a OpenAI planeja limitar o modelo a casos de uso específicos e acordos de parceria.

Já para fazer uma solicitação no ChatGPT por meio de uma imagem, basta o usuário tirar uma foto ou desenhar um item de seu interesse e enviar para o bot. Durante a comunicação, você pode usar instruções de texto ou voz para esclarecer sua solicitação ou limitar a área de pesquisa.

Obviamente, usar imagens como dicas do chatbot também tem seus problemas potenciais. Trata-se principalmente de uma consulta sobre a identidade de uma pessoa em uma foto, embora a OpenAI afirme que limitou a “capacidade do ChatGPT de analisar e fazer declarações diretas sobre as pessoas” por razões de precisão e privacidade.

Quase um ano após o lançamento inicial do ChatGPT, a OpenAI continua a ultrapassar os limites da aplicação e da utilização do seu chatbot, tentando evitar os problemas e deficiências a ele associados. Em particular, a empresa limita deliberadamente as capacidades dos seus novos modelos de IA. Mas esta abordagem não funcionará para sempre. À medida que mais pessoas usam o controle de voz e a pesquisa de imagens, e o ChatGPT se torna um assistente virtual multimodal e útil, manter a IA alinhada se tornará cada vez mais difícil.

avalanche

Próximo O Spotify dublará podcasts em línguas estrangeiras nas vozes dos próprios autores usando IA »

Anterior « As autoridades chinesas alocarão outros US$ 13,7 bilhões para o desenvolvimento da indústria de semicondutores

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

MicroLEDs substituem lasers: Microsoft cria interconexões ópticas de última geração com eficiência energética para data centers de IA.

Pesquisadores da Microsoft em Cambridge, no Reino Unido, estão explorando o uso de interconexões ópticas…

24 minutos atrás

Notícias da rede

O estúdio responsável pelos clássicos jogos Rainbow Six e Ghost Recon vai parar de produzir jogos – a Ubisoft demitiu todos os desenvolvedores da Red Storm Entertainment.

O programa de redução de custos da Ubisoft, parte de uma grande reestruturação organizacional e…

1 hora atrás

Carros, motos, veículos

O CEO da Ferrari explica a popularidade das telas sensíveis ao toque nos carros: elas custam metade do preço dos botões.

O CEO da Ferrari, Benedetto Vigna, concedeu recentemente uma longa entrevista à publicação britânica Autocar.…

1 hora atrás

Casos, computadores desktop

A Arctic apresentou o Senza AI 370, um PC para instalação sob a mesa — e ele também é silencioso.

A Arctic apresentou o Senza AI 370, um computador de mesa sem ventoinhas que se…

2 horas atrás

Jogos

Um novo trailer confirma a data de lançamento e o preço de Vampire Crawlers, o frenético jogo de cartas derivado de Vampire Survivors.

A desenvolvedora londrina poncle anunciou a data de lançamento e o preço de seu roguelike…

2 horas atrás

Editor gráfico

O gerador de imagens com IA do Adobe Firefly agora pode ser treinado com seus próprios trabalhos.

A Adobe anunciou o lançamento de geradores de imagens com IA personalizáveis que podem imitar…

2 horas atrás

ChatGPT aprendeu a entender comandos de voz e trabalhar com imagens

Conteúdo relacionado

Postagens recentes

MicroLEDs substituem lasers: Microsoft cria interconexões ópticas de última geração com eficiência energética para data centers de IA.

O estúdio responsável pelos clássicos jogos Rainbow Six e Ghost Recon vai parar de produzir jogos – a Ubisoft demitiu todos os desenvolvedores da Red Storm Entertainment.

O CEO da Ferrari explica a popularidade das telas sensíveis ao toque nos carros: elas custam metade do preço dos botões.

A Arctic apresentou o Senza AI 370, um PC para instalação sob a mesa — e ele também é silencioso.

Um novo trailer confirma a data de lançamento e o preço de Vampire Crawlers, o frenético jogo de cartas derivado de Vampire Survivors.

O gerador de imagens com IA do Adobe Firefly agora pode ser treinado com seus próprios trabalhos.