Categorias: Mercado de tecnologia e TI. notícia

Alucinações de radiação: falhas de hardware podem causar erros na operação de sistemas de IA

A empresa Meta✴, segundo o The Register, realizou um estudo cujos resultados indicam que podem surgir erros no funcionamento dos sistemas de IA devido a falhas de hardware, e não apenas devido a algoritmos imperfeitos. Isso pode levar a respostas de IA imprecisas, estranhas ou simplesmente ruins.

Diz-se que falhas de hardware podem causar corrupção de dados. Estamos falando, em particular, do chamado “bit flip”, quando o valor de uma célula de memória pode mudar arbitrariamente de “0” lógico para “1” lógico ou vice-versa. Isto leva ao aparecimento de valores falsos, o que pode resultar no funcionamento incorreto das aplicações de IA. Uma das causas dos erros é a radiação cósmica e, com o aumento da densidade dos recursos, sua influência aumenta. No entanto, em sistemas complexos modernos, tais erros, por vários motivos, podem ocorrer em qualquer fase do armazenamento, transmissão e processamento de informações.

Um erro em um bit de um parâmetro altera significativamente a resposta da IA (Fonte: Meta✴)

Essas falhas de hardware não detectadas, que não podem ser detectadas e corrigidas imediatamente, resultam em corrupção silenciosa de dados (SDC). Tais erros podem provocar alterações nos parâmetros da IA, o que acaba levando a inferências incorretas. Alega-se que, em média, 4 em cada 1.000 resultados de inferência são imprecisos devido a problemas de hardware. “A crescente complexidade e heterogeneidade das plataformas de IA torna-as cada vez mais suscetíveis a falhas de hardware”, afirma o estudo Meta✴. Nesse caso, alterar um bit pode fazer com que os erros cresçam como uma bola de neve.

Para avaliar possíveis avarias, propõe-se a introdução de um novo valor – “Parâmetro Fator de Vulnerabilidade” (PVF). O PVF mostra a probabilidade de que a corrupção de um parâmetro específico acabe levando a uma resposta incorreta do modelo de IA. Espera-se que esta métrica padronize a avaliação quantitativa da vulnerabilidade de um modelo de IA a possíveis falhas de hardware. O indicador PVF pode ser otimizado para vários modelos e tarefas. A métrica também é proposta para ser utilizada na fase de treinamento de IA e para identificar parâmetros cuja integridade precisa ser monitorada.

Os fabricantes de hardware também estão a tomar medidas para melhorar a fiabilidade e estabilidade das suas soluções. Assim, a NVIDIA enfatizou especificamente a importância do RAS nos aceleradores Blackwell. É verdade que isso é feito principalmente para aumentar a estabilidade de clusters ultragrandes, cujo tempo de inatividade devido a erros será muito caro.

avalanche

Próximo Um poderoso observatório sino-francês de explosão de raios gama lançado ao espaço »

Anterior « Tesla demitiu 14% dos trabalhadores em todo o mundo este ano

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Jogos

“É como se alguém tivesse cruzado a jogabilidade de BioShock com os gráficos de Cuphead”: Jornalistas mostraram 12 minutos de gameplay do clássico jogo de tiro noir Mouse: P.I. For Hire.

Como parte da série IGN First, a IGN apresentou uma nova demonstração de jogabilidade do…

31 minutos atrás

Periféricos de áudio / vídeo, fones de ouvido, webcams

Imagens dos fones de ouvido sem fio Galaxy Buds4 e Buds4 Pro da Samsung surgiram antes do anúncio oficial.

A Samsung deverá apresentar oficialmente os fones de ouvido sem fio Galaxy Buds4 e Galaxy…

31 minutos atrás

Processadores

A AMD deu a entender que poderá lançar a próxima geração do Xbox – e a espera não será longa.

O crescimento da receita da AMD no segmento de jogos no último trimestre, conforme destacado…

42 minutos atrás

Comentários sobre eventos recentes

A Qualcomm perdeu os dois criadores dos núcleos de processador Oryon, que esperava usar para conquistar uma fatia do mercado de PCs.

A Qualcomm anunciou oficialmente a saída de dois dos principais designers de processadores para PCs…

1 hora atrás

Jogos

A Take-Two negou os rumores sobre um possível atraso no lançamento físico de GTA VI e confirmou quando a campanha publicitária do jogo terá início.

Contrariando os temores dos fãs, a Take-Two Interactive não confirmou outro adiamento para o ambicioso…

2 horas atrás

Comentários sobre eventos recentes

CEO da Nvidia nega rumores de perda de interesse em investimentos na OpenAI.

Há vários dias, a mídia está repleta de rumores de que a Nvidia pode abandonar…

3 horas atrás