O AI Safety Institute (AISI) do Reino Unido, criado em novembro de 2023, lançou o Inspect, uma plataforma projetada para testar e avaliar a segurança da IA. Simplificará a avaliação da IA para utilização em organizações industriais, de investigação e científicas.
Fonte da imagem: geralt/Pixabay
O kit de ferramentas Inspect, disponível sob licenças de código aberto, incluindo licenças do MIT, foi projetado para avaliar capacidades específicas de modelos de IA em uma variedade de domínios, incluindo conhecimento básico de modelos e capacidade de raciocínio, e desenvolver uma avaliação com base nos resultados.
De acordo com o TechCrunch, a plataforma Inspect consiste em três componentes principais: conjuntos de dados, ferramentas de solução e ferramentas de avaliação. Os conjuntos de dados fornecem amostras para testes de avaliação. As ferramentas de solução fazem o trabalho de execução dos testes. E as ferramentas de avaliação avaliam os resultados e resumem as pontuações dos testes em métricas.
Os componentes do Inspect podem ser estendidos usando pacotes de terceiros escritos em Python. “Esperamos que a comunidade global de IA use o Inspect não apenas para conduzir seus próprios testes de segurança de modelo, mas também para adaptar e evoluir a plataforma de código aberto para que possamos produzir avaliações de alta qualidade em todos os níveis”, disse o presidente da AISI, Ian Hogarth ( Ian Hogarth).
A plataforma Inspect foi introduzida dias depois que o Instituto Nacional de Padrões e Tecnologia (NIST) anunciou o programa NIST GenAI no final de abril, projetado para avaliar várias tecnologias generativas de IA, incluindo modelos de geração de texto e imagens.
Em Abril, os EUA e o Reino Unido anunciaram uma parceria na qual “os governos partilharão conhecimentos técnicos, informações e talentos em matéria de segurança da IA”. Como parte da colaboração, será criado um Instituto de Segurança de IA nos Estados Unidos, que avaliará os riscos associados à IA e à IA generativa.
A Meta✴ anunciou que permitirá que desenvolvedores de chatbots de terceiros ofereçam seus serviços de…
A Astrum Entertainment, editora e desenvolvedora russa, anunciou o lançamento da temporada de conteúdo "Steel…
O estúdio espanhol Infinite Thread Games revelou um trailer de Hidalgo, uma aventura com uma…
A Nebius comemorou a aprovação, pelo Conselho Municipal de Independence, Missouri, de um plano de…
O Grupo de Inteligência de Ameaças do Google (GTI) rastreou 90 vulnerabilidades zero-day exploradas ativamente…
No Mobile World Congress 2026 em Barcelona, a TECNO organizou um grande estande onde apresentou…