Categorias: Gráficos 3D

A Apple ensinou a inteligência artificial a construir cenas 3D a partir de uma única foto – de forma rápida e sem palpites (3DNews).

A Apple publicou um artigo intitulado “Síntese de Imagem Monocular Nítida em Menos de um Segundo”, detalhando como treinou um modelo de IA para construir cenas 3D a partir de uma única imagem plana, proporcionando distâncias e escala realistas.

Fonte da imagem: x.com/timd_ca

A tarefa do modelo de IA é prever uma representação 3D de uma cena renderizada a partir de pontos de vista próximos. Em vez de modelos 3D rígidos tradicionais, a cena é construída a partir de representações 3D de uma função gaussiana — pequenos pontos desfocados de cor e luz localizados no espaço. Combinando vários milhões desses pontos, uma imagem específica pode ser reconstruída, parecendo idêntica do mesmo ponto de vista. Normalmente, alcançar esse resultado requer dezenas, senão centenas, de imagens tiradas de diferentes ângulos. O modelo SHARP da Apple prevê uma representação 3D completa usando o desdobramento gaussiano a partir de uma única fotografia e em uma única passagem da rede neural.

Para alcançar isso, os engenheiros da Apple treinaram o SHARP com uma grande quantidade de dados sintéticos e do mundo real, permitindo que o modelo aprendesse padrões gerais de profundidade e geometria em várias cenas. Dada uma nova foto, ele estima a profundidade, refina-a usando o conhecimento existente e, em seguida, prevê a posição e a aparência dos “sinos de Gauss” 3D em uma única passagem. No entanto, esse método tem uma desvantagem: o SHARP representa com precisão os ângulos próximos, mas não preenche as partes ocultas da cena. Isso significa que o usuário não poderá se afastar muito do ponto de vista de onde a foto foi tirada.

Graças a isso, os pesquisadores da Apple conseguiram uma velocidade bastante alta para o modelo, produzindo resultados em menos de um segundo com alta estabilidade. A empresa publicou o código-fonte do SHARP no GitHub. Curiosamente, em um exemplo, os arquivos-fonte…Os modelos 3D deixaram de ser imagens estáticas e passaram a ser arquivos de vídeo.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A NASA tem um novo diretor: o bilionário Jared Isaacman, amigo de Musk e astronauta privado. (3DNews)

O Senado dos EUA confirmou Jared Isaacman como Administrador da NASA por ampla maioria. Isaacman…

24 minutos atrás

O criador de Stardew Valley deixou os fãs curiosos com uma prévia da atualização 1.7 – e parece que ela também será enorme.

A atualização 1.7 para o simulador de fazenda Stardew Valley, do desenvolvedor Eric Barone, mais…

50 minutos atrás

O iPhone mais caro pode se tornar o mais escasso – analistas preveem problemas de produção (3DNews)

Segundo analistas, a Apple lançará seu primeiro smartphone dobrável, provisoriamente chamado de iPhone Fold, no…

2 horas atrás

Rue Valley, RPG inspirado em Disco Elysium, recebeu uma grande atualização com um novo final e melhorias baseadas no feedback dos usuários.

A editora Owlcat Games e os desenvolvedores do estúdio sérvio Emotion Spark Studio anunciaram o…

2 horas atrás

A Apple alertou o 3DNews que haverá mais anúncios de pesquisa na App Store.

A Apple aumentará a quantidade de anúncios exibidos nos resultados de busca da App Store.…

2 horas atrás

A Meta lucrou bilhões com publicidade fraudulenta; Zuckerberg encerrou a luta contra ela.

No ano passado, a Meta✴ faturou mais de US$ 3 bilhões na China com publicidade…

2 horas atrás