Foi desenvolvido um sistema para treinar IA em dados danificados – isso protegerá contra reivindicações de detentores de direitos autorais

Modelos de inteligência artificial que geram imagens baseadas em descrições de texto, quando treinados em imagens originais, podem “lembrar” delas, levantando assim a questão da violação de direitos autorais. Para proteger contra reivindicações de detentores de direitos autorais, o sistema Ambient Diffusion foi desenvolvido para treinar modelos de IA apenas em dados danificados.

Fonte da imagem: github.com/giannisdaras

Os modelos de difusão são algoritmos avançados de aprendizado de máquina que geram recursos de alta qualidade introduzindo gradualmente ruído em um conjunto de dados e, em seguida, revertendo o processo. Estudos mostraram que tais modelos são capazes de lembrar amostras da matriz de treinamento. Este recurso pode ter consequências desagradáveis ​​em termos de privacidade, segurança e direitos autorais. Por exemplo, se a IA for treinada para trabalhar com raios X, não precisará lembrar imagens de pacientes específicos.

Para evitar esses problemas, pesquisadores da Universidade do Texas em Austin e da Universidade da Califórnia em Berkeley desenvolveram a estrutura Ambient Diffusion para treinar modelos de difusão de IA apenas em imagens que foram danificadas de forma irreconhecível, tornando virtualmente impossível para a IA “lembrar” e reproduzir a obra original.

Para confirmar a sua hipótese, os cientistas treinaram um modelo de IA em 3.000 imagens de celebridades da base de dados CelebA-HQ. Ao receber uma solicitação, esse modelo passou a gerar imagens quase idênticas às originais. Depois disso, os pesquisadores treinaram novamente o modelo usando 3.000 imagens com danos graves – até 90% dos pixels estavam mascarados. Então ela começou a gerar rostos humanos realistas e muito diferentes dos originais. Os autores publicaram os códigos-fonte do projeto no GitHub.

avalanche

Postagens recentes

AI chegou à área de transferência do Windows 11

A Microsoft adicionou um novo recurso Advanced Paste ao pacote de utilitários PowerToys para Windows…

1 hora atrás

Cresça do júnior ao médio no verão com um curso de presentes da Praktikum

O LinkedIn realizou um estudo e descobriu quem aumenta sua nota mais rápido que seus…

1 hora atrás

A BYD lançará um carro elétrico econômico Seagull na Europa – muito mais caro que na China, mas ainda mais barato que seus concorrentes

Enquanto os fabricantes de automóveis europeus tentam formar alianças para produzirem em conjunto veículos eléctricos…

2 horas atrás

O Ministério do Desenvolvimento Digital decidiu introduzir “Serviços Governamentais” nos alto-falantes inteligentes do Yandex e do Sberbank.

O Ministério do Desenvolvimento Digital, Comunicações e Comunicações de Massa da Federação Russa está trabalhando…

2 horas atrás

A IA penetrou nos “Serviços do Estado” – o Ministério do Desenvolvimento Digital está testando várias redes neurais generativas no “Max”

O Ministério do Desenvolvimento Digital, Comunicações e Comunicações de Massa da Federação Russa está testando…

2 horas atrás