Categorias: Mercado de tecnologia e TI. notíciaNotícias da rede

O Google ensinou inteligência artificial a aumentar a resolução da foto em até 16 vezes sem perda de qualidade

O Google postou em seu blog um estudo da equipe interna do cérebro intitulado “Criando imagens de alta fidelidade usando modelos de difusão”. Neste artigo, os pesquisadores falam sobre os novos avanços que fizeram no dimensionamento de imagens digitais sem perder qualidade.

Petapixel.com

A equipe do Google Brain treinou um modelo de aprendizado de máquina para transformar fotos de baixa resolução em imagens detalhadas de alta resolução sem praticamente nenhuma perda de qualidade. Os especialistas acreditam que seu desenvolvimento pode ser usado para uma variedade de propósitos, desde melhorar fotos antigas de família até melhorar a qualidade de imagens médicas.

Petapixel.com

O conceito de modelos de difusão tem sido estudado pelo Google desde 2015, mas até recentemente, o gigante das buscas preferia outra família de métodos de treinamento de IA – modelos gerativos profundos. A empresa descobriu que os resultados da nova abordagem eram nitidamente superiores às tecnologias existentes.

Petapixel.com

A nova abordagem foi designada SR3. O Google diz que SR3 é um modelo de difusão de ultra-alta resolução que cria uma imagem de alta resolução a partir de ruído puro com base na imagem original de baixa resolução. O modelo é treinado no processo de distorção da imagem, no qual o ruído é gradualmente adicionado à imagem até que apenas o ruído puro permaneça. O algoritmo então inverte o processo, removendo gradativamente o ruído da imagem, guiado pela imagem original de baixa resolução.

Petapixel.com

O SR3 apresentou melhor desempenho ao dimensionar retratos e fotos da natureza. O algoritmo permite que você obtenha imagens fotorrealísticas enquanto aumenta a resolução de retratos em até dezesseis vezes.

Petapixel.com

Depois que o Google se convenceu da eficácia do SR3, a empresa foi ainda mais longe com outra abordagem chamada CDM, que é um modelo de difusão de classes condicionalmente. O CDM é treinado em dados da ImageNet, que contém mais de 14 milhões de imagens de alta resolução. O CDM propõe uma abordagem em cascata que primeiro gera uma imagem de baixa resolução, seguida pelo trabalho do SR3 para criar imagens de alta resolução que são gradualmente aumentadas para o mais alto possível. De acordo com o Google, uma imagem com resolução de 32 × 32 pixels pode ser ampliada para 256 × 256 pixels sem perda perceptível, oito vezes. Uma imagem com resolução de 64 × 64 pixels foi completamente dimensionada para uma resolução de 1024 × 1024 pixels, 16 vezes.

Petapixel.com

Os resultados do trabalho de IA são realmente impressionantes. As imagens finais, apesar de pequenas falhas, parecem muito boas e são percebidas pela maioria dos usuários como as imagens originais.

avalanche

Próximo Os pesquisadores construíram uma sala de energia que carrega sem fio qualquer coisa que entre nela »

Anterior « Falando sobre Isaac, inimigos em camadas e a transição para o desenvolvimento ativo: novos detalhes e primeiros quadros da jogabilidade do remake de Dead Space

Deixar comentário

Publicado por

avalanche

5 anos atrás

Postagens recentes

Consoles de jogos

A Sony estava desenvolvendo um controle DualShock com o primeiro PlayStation integrado, mas o projeto foi cancelado.

Um ex-desenvolvedor da Sony apresentou um protótipo do console PlayStation Puga, que nunca chegou ao…

2 horas atrás

Carros, motos, veículos

A participação da Tesla no mercado global de veículos elétricos fabricados na China caiu para menos de 30% das remessas pela primeira vez desde 2020.

A fábrica da Tesla em Xangai é única não apenas por ter sido construída em…

7 horas atrás

O mundo da robótica

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

Os desenvolvedores de robôs humanoides estão ansiosos para demonstrar progressos significativos em seu desenvolvimento, mas,…

8 horas atrás

Notícias da rede

A decisão da Sony de parar de lançar jogos em disco irá remodelar permanentemente o mercado de jogos.

A recente decisão da Sony de interromper o lançamento de jogos para seus consoles em…

8 horas atrás

Clientes de MI

As autoridades indianas exigiram que o Telegram tome medidas decisivas em 15 dias para combater a disseminação de conteúdo pirateado.

Em junho, as autoridades reguladoras indianas já haviam bloqueado temporariamente o Telegram, alegando a necessidade…

9 horas atrás

A NVIDIA disponibilizou discretamente a plataforma Omniverse gratuitamente, mas há um porém.

A NVIDIA anunciou discretamente mudanças no licenciamento da plataforma NVIDIA Omniverse. De acordo com a…

15 horas atrás

O Google ensinou inteligência artificial a aumentar a resolução da foto em até 16 vezes sem perda de qualidade

Conteúdo relacionado

Postagens recentes

A Sony estava desenvolvendo um controle DualShock com o primeiro PlayStation integrado, mas o projeto foi cancelado.

A participação da Tesla no mercado global de veículos elétricos fabricados na China caiu para menos de 30% das remessas pela primeira vez desde 2020.

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

A decisão da Sony de parar de lançar jogos em disco irá remodelar permanentemente o mercado de jogos.

As autoridades indianas exigiram que o Telegram tome medidas decisivas em 15 dias para combater a disseminação de conteúdo pirateado.

A NVIDIA disponibilizou discretamente a plataforma Omniverse gratuitamente, mas há um porém.