A Apple usa IA para ajudar pessoas cegas a “ver” as ruas — SceneScout mostra o caminho com voz

O SceneScout é um projeto de pesquisa da Apple e da Universidade Columbia que visa ajudar pessoas cegas e com baixa visão a se orientarem em seus arredores. Ele combina os recursos do Apple Maps e do GPT-4o. Os usuários podem não apenas obter direções passo a passo e pontos de referência, mas também explorar literalmente toda a rota, quarteirão por quarteirão.

Fonte da imagem: Apple

O sistema oferece dois modos. A Visualização de Rota dá uma ideia do que uma pessoa encontrará no caminho: informa sobre obstáculos na calçada, a presença de cruzamentos e diversos pontos de referência visuais. No modo Exploração Virtual, o usuário diz o que está procurando (por exemplo, “uma área residencial tranquila com parques”) e a IA, com base na solicitação, o leva passo a passo até o local desejado.

O SceneScout é guiado pelo Apple Maps e simula o campo de visão de um pedestre. O sistema interpreta o que “vê” e prepara um texto estruturado, dividido em descrições curtas, médias ou longas.

Por exemplo, o sistema pode informar: “Há carros estacionados em frente ao prédio. Placas de rua indicam que esta é a Rua Figueroa. Você encontrará um Bank of America à direita.” Ou: “Há calçadas largas com árvores e algumas lojas. Você também pode ver viadutos conectando os prédios acima da rua.”

Os primeiros testes, que envolveram 10 pessoas com deficiência visual, mostraram resultados promissores. Os participantes avaliaram muito bem a utilidade do serviço e destacaram especialmente o modo Exploração Virtual.

No entanto, não estava isento de falhas. Algumas das dicas continham imprecisões, como placas de trânsito com rótulos incorretos ou informações desatualizadas sobre obras e veículos estacionados.

Ainda é cedo para falar sobre a implementação do SceneScout. O objetivo principal do projeto é explorar a interação entre a API do Apple Maps e um modelo multimodal de linguagem de grande porte.

admin

Postagens recentes

Mais rápido e inteligente: SiFive revela segunda geração de núcleos inteligentes RISC-V

A SiFive apresenta a segunda geração da família RISC-V Intelligent Core, que inclui os novos…

16 minutos atrás

Meta continua êxodo em massa de especialistas em IA — Zuckerberg tenta impedir, mas não consegue

Muitos especialistas altamente qualificados na área de inteligência artificial começaram a deixar a Meta✴. A…

26 minutos atrás

Hackers white hat revelam senhas de ‘administrador’ e outras falhas de segurança cibernética no Burger King

Os hackers éticos BobDaHacker e BobTheShoplifter anunciaram a descoberta de “vulnerabilidades catastróficas” nos sistemas de…

26 minutos atrás

Microsoft testa novos recursos de IA no Explorador de Arquivos do Windows 11

A Microsoft está testando novos recursos com tecnologia de IA que permitirão que usuários do…

34 minutos atrás

Ex-funcionário processa WhatsApp por ignorar questões de segurança cibernética

Um ex-executivo de alta responsabilidade em segurança cibernética do WhatsApp entrou com uma ação judicial…

2 horas atrás