Esta semana, a OpenAI lançou seus modelos de IA mais recentes, o3 e o4-mini, que podem raciocinar usando fotos enviadas pelos usuários. Na prática, eles cortam, giram e ampliam imagens, mesmo as borradas e distorcidas, e realizam uma análise completa delas. Recursos avançados de análise fazem do ChatGPT um poderoso localizador.

Fonte da imagem: ilgmyzin / unsplash.com

O modelo de raciocínio o3 do OpenAI, conforme determinado pelos usuários da rede social X, provou ser bom em identificar cidades, pontos de referência e até mesmo estabelecimentos de alimentação mostrados em fotografias com base em pistas visuais quase imperceptíveis. Em muitos casos, a IA dispensa a análise da correspondência anterior com o usuário e a geolocalização nos metadados. O ChatGPT exibe cardápios de restaurantes, fotos de bairros, fachadas de prédios e selfies deles mesmos, e supostamente convida os usuários a jogar GeoGuessr, um jogo em que eles adivinham locais a partir de vistas panorâmicas no Google Maps.

Fonte da imagem: x.com/izyuuumi

Há preocupações óbvias com a privacidade: um invasor hipotético poderia fazer uma captura de tela do Instagram✴ Stories de um usuário e revelar informações sobre ele para fins de bullying ou outras atividades ilegais. Na verdade, essa função do ChatGPT funcionava até mesmo antes do lançamento do o3 e do o4-mini, observou o TechCrunch: seus jornalistas tentaram fazer o mesmo truque com uma versão do chatbot baseada no modelo GPT-4o – ele deu basicamente os mesmos resultados e respondeu mais rápido. O modelo o3, sendo mais poderoso, respondia corretamente com mais frequência, mas às vezes falhava.

Fonte da imagem: x.com/swax

A OpenAI não mencionou esse uso em seus relatórios de segurança para os modelos o3 e o4-mini. Mas ela deu um comentário detalhado ao TechCrunch: “O OpenAI o3 e o o4-mini trazem raciocínio visual para o ChatGPT, tornando-o mais útil em áreas como acessibilidade, pesquisa ou resposta a emergências com base em localização. Trabalhamos para treinar nossos modelos para rejeitar solicitações de informações privadas ou sensíveis, adicionamos salvaguardas para impedir que o modelo identifique indivíduos em imagens; monitoramos ativamente e tomamos medidas contra o abuso de nossas políticas de privacidade.”

avalanche

Postagens recentes

Um novo trailer de jogabilidade revelou a data de lançamento do ambicioso jogo de estratégia por turnos Warhammer 40.000: Mechanicus 2.

A editora Kasedo Games e a desenvolvedora francesa Bulwark Studios (Ixion) finalmente anunciaram a data…

55 minutos atrás

Se vamos nos divertir, que seja para valer: a TSMC elevou sua previsão de receita para a indústria de semicondutores para US$ 1,5 trilhão até 2030.

Nos últimos anos, muitos especialistas, incluindo a administração da TSMC, citaram US$ 1 trilhão como…

2 horas atrás

O Google está desenvolvendo um recurso para tradução simultânea de fala sem conexão com a internet.

O Google fez avanços significativos na tecnologia de tradução automática, abrangendo inúmeros pares de idiomas…

3 horas atrás

A Apple ainda permitirá agentes de IA autônomos na App Store, mas com restrições.

A Apple está explorando a possibilidade de permitir agentes de IA autônomos na App Store,…

4 horas atrás