OpenAI expandiu as opções de interação com ChatGPT. A nova versão do chatbot agora aceita não apenas texto, mas também imagens e comandos de voz como prompts. Para usuários comerciais, novos recursos estarão disponíveis nas próximas duas semanas, mas outros terão que esperar um pouco.

Fonte da imagem: The Verge

As conversas de voz com ChatGPT são um tanto semelhantes às conversas com qualquer assistente de voz, mas a OpenAI afirma que a qualidade das respostas é significativamente maior devido à tecnologia subjacente aprimorada. O usuário pressiona um botão e faz uma pergunta, o ChatGPT converte em texto e a alimenta em um modelo de linguagem maior, recebe a resposta, converte de volta em fala e fala a resposta em voz alta.

Os novos recursos do ChatGPT contam com o modelo maior de linguagem Whisper, que faz grande parte do trabalho de conversão de fala em texto e vice-versa. De acordo com a OpenAI, o novo modelo pode gerar “uma voz humana a partir de um texto e uma amostra de fala com alguns segundos de duração”. Existem atualmente cinco opções de voz ChatGPT disponíveis, mas a OpenAI vê muito mais potencial neste modelo.

A capacidade de criar uma voz sintetizada de qualquer pessoa com base em apenas alguns segundos de sua fala oferece um amplo campo de atividade para os cibercriminosos, admite a OpenAI no anúncio de novos recursos: “São novos riscos, como a capacidade dos invasores de personificar figuras públicas ou cometer fraude.” Segundo a empresa, o modelo não está disponível para uso generalizado por este motivo: a OpenAI planeja limitar o modelo a casos de uso específicos e acordos de parceria.

Já para fazer uma solicitação no ChatGPT por meio de uma imagem, basta o usuário tirar uma foto ou desenhar um item de seu interesse e enviar para o bot. Durante a comunicação, você pode usar instruções de texto ou voz para esclarecer sua solicitação ou limitar a área de pesquisa.

Obviamente, usar imagens como dicas do chatbot também tem seus problemas potenciais. Trata-se principalmente de uma consulta sobre a identidade de uma pessoa em uma foto, embora a OpenAI afirme que limitou a “capacidade do ChatGPT de analisar e fazer declarações diretas sobre as pessoas” por razões de precisão e privacidade.

Quase um ano após o lançamento inicial do ChatGPT, a OpenAI continua a ultrapassar os limites da aplicação e da utilização do seu chatbot, tentando evitar os problemas e deficiências a ele associados. Em particular, a empresa limita deliberadamente as capacidades dos seus novos modelos de IA. Mas esta abordagem não funcionará para sempre. À medida que mais pessoas usam o controle de voz e a pesquisa de imagens, e o ChatGPT se torna um assistente virtual multimodal e útil, manter a IA alinhada se tornará cada vez mais difícil.

avalanche

Postagens recentes

TrendForce: Os investimentos de capital de oito empresas de hiperescala em 2026 ultrapassarão o PIB da Irlanda.

Este ano, a TrendForce estima que os oito maiores provedores de nuvem do mundo —…

58 minutos atrás

A NASA alterou radicalmente o programa Artemis para evitar perder a corrida lunar para a China: o pouso foi adiado e o módulo de pouso SLS foi reduzido.

Altos funcionários dos EUA afirmaram repetidamente que um segundo pouso lunar da China antes dos…

58 minutos atrás

Supermicro apresenta plataforma MicroBlade de alta densidade baseada no AMD EPYC 4005

A Supermicro anunciou sua nova plataforma de servidores MicroBlade para implantações em nuvem e edge…

1 hora atrás

O remake de Bloodborne da Bluepoint Games quase se tornou realidade — a Sony aprovou o projeto, mas havia um porém.

Ao longo de todos esses anos, os fãs culparam a Sony Interactive Entertainment, dona da…

2 horas atrás

A Meta não conseguiu criar seu próprio chip de IA porque é “muito complicado” e sofre com “problemas técnicos”.

A Meta✴ encontrou dificuldades no desenvolvimento de seus próprios aceleradores para sistemas de inteligência artificial…

2 horas atrás

A Dell apresentou o servidor externo PowerEdge XR9700 com sistema de refrigeração de circuito fechado.

A Dell anunciou o servidor PowerEdge XR9700, projetado para infraestruturas Cloud RAN e aplicações de…

4 horas atrás