Os maiores sites da Internet proibiram a Apple de coletar seus dados para treinamento de IA

Uma das fontes de dados para treinar sistemas generativos de inteligência artificial são os recursos da web disponíveis publicamente. A Apple deu a seus proprietários a oportunidade de optar por não coletar dados para treinar o sistema Apple Intelligence, e muitos dos maiores recursos aproveitaram essa oportunidade. Isso inclui Facebook✴ e Instagram✴, bem como os principais meios de comunicação e notícias, incluindo o New York Times e o The Atlantic.

Nos últimos anos, a Apple tem usado um rastreador da web chamado AppleBot, que usa os dados coletados para treinar o Siri e o mecanismo de busca Spotlight. E, mais recentemente, a empresa conectou-se ao AppleBot e ao Apple Intelligence. Esta é uma prática controversa, uma vez que a IA moderna toma liberdade com materiais protegidos por direitos autorais – em áreas restritas onde não há muito material, os sistemas citam parágrafos inteiros quase inalterados.

A Apple afirma que coleta informações de forma ética, filtrando dados pessoais, usando apenas materiais licenciados e dados publicamente disponíveis provenientes do scanner AppleBot. Para dar aos webmasters a oportunidade de se recusarem a coletar informações apenas para treinamento em IA, a empresa usou o pseudônimo Applebot-Extended – a indexação de pesquisa padrão permanece em vigor quando esse pseudônimo é proibido.

A recusa é realizada inserindo a diretiva apropriada no arquivo robots.txt disponível publicamente nos recursos da web, o que significa que qualquer pessoa tem a oportunidade de ver qual editor bloqueou o acesso ao Apple Intelligence. Isso foi feito pelo Facebook✴, Instagram✴, Craigslist, Tumblr, New York Times, Financial Times, The Atlantic, Vox Media, USA Today Network e Condé Nast, revista Wired estabelecida. Pouco mais de um quarto dos principais sites de notícias americanos (294 de 1.167) recusaram-se a permitir a entrada da IA ​​da Apple em seus sites, disse o jornalista Ben Welsh.

De acordo com informações não confirmadas, a Apple celebrou acordos com algumas empresas de mídia, pagando-lhes pelo direito de usar seus materiais para treinar IA. Provavelmente, estas considerações estão a atrasar outros recursos – estão simplesmente à espera de dinheiro.

avalanche

Postagens recentes

O Snapdragon X2 Plus mostrou-se mais rápido que os processadores Intel e AMD, mas perdeu para o Apple M4 nos primeiros testes.

A PC Magazine testou os processadores Snapdragon X2 Plus, apresentados pela Qualcomm na CES 2026,…

31 minutos atrás

O mercado de semicondutores cresceu 21%, atingindo US$ 793 bilhões no ano passado, com a Intel saindo do grupo das três maiores empresas.

Especialistas da Gartner já resumiram os resultados do mercado de semicondutores do ano passado, relatando…

32 minutos atrás

O CEO da Nvidia não acredita em “IA divina” e critica previsões pessimistas.

A Nvidia continua sendo uma das principais beneficiárias do boom da IA, e por isso…

45 minutos atrás

A Thermalright apresentou o Frost Tower 140, um grande cooler de torre dupla com ventoinhas de tamanhos variados.

A Thermalright lançou o Frost Tower 140, um cooler para CPU de torre dupla. O…

59 minutos atrás

8 núcleos RISC-V e um slot PCIe 4.0 x16: a placa-mãe Milk-V Titan Mini-ITX já está disponível.

A Shenzhen MilkV Technology (Milk-V), segundo a CNX Software, começou a aceitar encomendas para a…

1 hora atrás

Um erro de atualização de software corrompeu 13.000 passaportes irlandeses.

O Ministério das Relações Exteriores da Irlanda informou que foi obrigado a recolher quase 13.000…

1 hora atrás