ChatGPT ganhou visão – o bot aprendeu a entender as transmissões de vídeo da câmera e da tela de um smartphone

A OpenAI anunciou que o chatbot ChatGPT, alimentado por inteligência generativa, tem a capacidade de processar um stream de vídeo e conversar com os usuários sobre o que está “observando” usando um smartphone ou câmera de computador, ou o que vê na tela do dispositivo. O novo recurso está disponível no Modo de Voz Avançado.

Fonte da imagem: OpenAI

A empresa anunciou que o ChatGPT receberá uma função de visão computacional que permite “ver” pela câmera do smartphone do usuário ou por meio de transmissão de tela. Proprietários de assinaturas pagas ChatGPT Plus, Team e Pro agora têm acesso ao ChatGPT Enhanced Voice com reconhecimento de vídeo. A empresa afirma que os assinantes do ChatGPT Enterprise e Edu não receberão o recurso até janeiro e que não há cronograma para seu lançamento na UE, Suíça, Islândia, Noruega e Liechtenstein.

Em uma demonstração recente no programa 60 Minutes da CNN, o presidente da OpenAI, Greg Brockman, testou um modo de voz avançado com reconhecimento visual com o apresentador de TV Anderson Cooper sobre as habilidades anatômicas do chatbot. Quando Cooper desenhou partes do corpo no quadro, ChatGPT “entendeu” o que ele estava desenhando. Ao mesmo tempo, o ChatGPT cometeu um erro em uma tarefa de geometria neste modo, o que indica sua tendência a alucinar.

Desde seu anúncio em maio, a empresa atrasou diversas vezes o lançamento de um modo de voz aprimorado com reconhecimento visual. Em abril, a OpenAI prometeu que o modo estaria disponível para os usuários “dentro de algumas semanas”, mas admitiu meses depois que demoraria mais do que o planejado. E quando o Enhanced Voice foi lançado para alguns usuários em setembro, ele não tinha funcionalidade de visão computacional.

Google e Meta✴ também estão trabalhando em recursos semelhantes para seus chatbots. Esta semana, o Google disponibilizou seu recurso de IA de análise de vídeo em tempo real, Projeto Astra, para um grupo de “testadores confiáveis” na plataforma Android.

avalanche

Postagens recentes

Pela primeira vez na história, o CERN transporta antimatéria por caminhão.

Em 24 de março de 2026, o experimento BASE no CERN alcançou um feito histórico:…

1 hora atrás

Fim de uma era: a Xiaomi descontinuou a MIUI, a interface que tornou a empresa famosa.

A Xiaomi encerrou oficialmente o suporte para a MIUI, que já foi uma das interfaces…

2 horas atrás

A Apple lançou o iOS 26.4 e o iPadOS 26.4 com novos emojis e recursos.

As versões estáveis ​​do iOS 26.4 e do iPadOS 26.4 foram lançadas, seis semanas após…

2 horas atrás

As vendas de Marathon atingiram 1,2 milhão de cópias em três semanas, mas a Sony esperava mais.

Os desenvolvedores do estúdio americano Bungie (pertencente à Sony) estão relutantes em divulgar os números…

2 horas atrás

Meta mentiu sobre a segurança do Facebook, Instagram e WhatsApp para crianças; tribunal a multou em US$ 375 milhões.

Um júri do Novo México considerou a Meta culpada de violar a lei estadual em…

3 horas atrás

A escassez de processadores para PC está se agravando, com preços em alta e prazos de entrega já estendidos por meses.

Os preços da memória começaram a subir para os consumidores no segundo semestre do ano…

3 horas atrás