O AI Safety Institute (AISI) do Reino Unido, criado em novembro de 2023, lançou o Inspect, uma plataforma projetada para testar e avaliar a segurança da IA. Simplificará a avaliação da IA ​​para utilização em organizações industriais, de investigação e científicas.

Fonte da imagem: geralt/Pixabay

O kit de ferramentas Inspect, disponível sob licenças de código aberto, incluindo licenças do MIT, foi projetado para avaliar capacidades específicas de modelos de IA em uma variedade de domínios, incluindo conhecimento básico de modelos e capacidade de raciocínio, e desenvolver uma avaliação com base nos resultados.

De acordo com o TechCrunch, a plataforma Inspect consiste em três componentes principais: conjuntos de dados, ferramentas de solução e ferramentas de avaliação. Os conjuntos de dados fornecem amostras para testes de avaliação. As ferramentas de solução fazem o trabalho de execução dos testes. E as ferramentas de avaliação avaliam os resultados e resumem as pontuações dos testes em métricas.

Os componentes do Inspect podem ser estendidos usando pacotes de terceiros escritos em Python. “Esperamos que a comunidade global de IA use o Inspect não apenas para conduzir seus próprios testes de segurança de modelo, mas também para adaptar e evoluir a plataforma de código aberto para que possamos produzir avaliações de alta qualidade em todos os níveis”, disse o presidente da AISI, Ian Hogarth ( Ian Hogarth).

A plataforma Inspect foi introduzida dias depois que o Instituto Nacional de Padrões e Tecnologia (NIST) anunciou o programa NIST GenAI no final de abril, projetado para avaliar várias tecnologias generativas de IA, incluindo modelos de geração de texto e imagens.

Em Abril, os EUA e o Reino Unido anunciaram uma parceria na qual “os governos partilharão conhecimentos técnicos, informações e talentos em matéria de segurança da IA”. Como parte da colaboração, será criado um Instituto de Segurança de IA nos Estados Unidos, que avaliará os riscos associados à IA e à IA generativa.

avalanche

Postagens recentes

A inteligência artificial impulsionou repentinamente a demanda por CPUs, um aumento que a AMD e a Intel não previram.

Na Conferência de Tecnologia, Mídia e Telecomunicações de 2026 da Morgan Stanley, a AMD e…

2 horas atrás

“Quebra-cabeça em alta velocidade”: Ruiner 2, o jogo de ação cyberpunk, é anunciado com elementos cooperativos e de RPG não presentes no primeiro jogo.

A desenvolvedora Reikon Games anunciou Ruiner 2, sequência do jogo de ação cyberpunk de 2017,…

4 horas atrás

Um fabricante chinês popular de PCs acessíveis foi flagrado substituindo secretamente os processadores de laptops.

A Chuwi, uma popular fabricante chinesa de computadores e eletrônicos, foi flagrada enganando seus clientes.…

5 horas atrás

A Meta cedeu à UE e permitirá a entrada de bots de IA de terceiros no WhatsApp, mas isso pode custar-lhe uma fortuna.

A Meta✴ anunciou que permitirá que desenvolvedores de chatbots de terceiros ofereçam seus serviços de…

5 horas atrás

O retorno de um mapa lendário, um passe de batalha de primavera e uma atualização técnica: a temporada Steel Quarters começou no Warface.

A Astrum Entertainment, editora e desenvolvedora russa, anunciou o lançamento da temporada de conteúdo "Steel…

6 horas atrás