Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Cientistas descobriram que todos os parâmetros de referência de IA são ineficazes.

Cientistas do Reino Unido e dos Estados Unidos descobriram falhas graves em centenas de testes usados para verificar a segurança e o desempenho de novos modelos de inteligência artificial lançados ao público.

Fonte da imagem: Steve Johnson / unsplash.com

Cientistas da computação do Instituto de Segurança de IA do governo do Reino Unido, com o apoio de colegas de Oxford, Stanford e da Universidade da Califórnia, Berkeley, examinaram mais de 440 testes projetados para avaliar a segurança de sistemas de IA. Eles encontraram falhas que “minam a validade das alegações resultantes”, já que “quase todos apresentam falhas em pelo menos uma área”, e os resultados obtidos são “irrelevantes ou até mesmo enganosos”.

Na ausência de um padrão unificado, esses testes são usados por desenvolvedores, incluindo grandes empresas de tecnologia, para avaliar sua adequação à inteligência de nível humano e garantir que cumpram suas capacidades declaradas em raciocínio, resolução de problemas matemáticos e programação.

Fonte da imagem: Aidin Geranrekab / unsplash.com

No último fim de semana, o jornal The Guardian noticiou que o Google foi forçado a retirar seu modelo de IA de código aberto, Gemma, após este acusar um senador americano de cometer um crime grave contra um policial. O Google afirmou que os modelos Gemma eram destinados a desenvolvedores e pesquisadores, não a consumidores, mas os removeu da plataforma AI Studio após o surgimento de “relatos de tentativas de explorá-los por não desenvolvedores”. “Alucinações, em que os modelos simplesmente inventam respostas, e bajulação, em que os modelos dizem aos usuários o que eles querem ouvir, são problemas para todo o campo da IA, especialmente para modelos pequenos como o Gemma. Continuamos comprometidos em minimizar as alucinações e estamos aprimorando continuamente todos os nossos modelos”, assegurou o Google.

Cientistas examinaram testes disponíveis publicamente para sistemas de IA, mas líderes do setor também possuem seus próprios benchmarks, que ainda não foram estudados pela comunidade de especialistas. Eles enfatizaram a necessidade de desenvolver um padrão unificado para determinar o desempenho e a segurança dos modelos de IA. Os cientistas consideraram “chocante” que apenas 16% dos testes utilizem métodos de estimativa de erro estatístico para determinar a probabilidade de resultados precisos. Em alguns casos, quando é necessário determinar uma característica específica de um modelo de IA, como sua “inofensividade”, essa característica não é claramente definida, o que reduz o valor de todo o teste.

admin

Próximo A Cooler Master apresentou o Qube 540, um gabinete perfurado com alças e pés expostos. »

Anterior « Um tribunal ordenou que a Samsung pague US$ 191 milhões por infringir patentes da tecnologia OLED.

Deixar comentário

Publicado por

admin

8 meses atrás

Postagens recentes

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

A China lidera novamente o TOP500: o supercomputador LineShine, sem chips da Nvidia, Intel e AMD, torna-se o mais poderoso do mundo.

Em 23 de junho, a 67ª edição da lista TOP500 dos supercomputadores mais poderosos do…

1 hora atrás

Carros, motos, veículos

A soberania tecnológica da UE terá um custo elevado para os consumidores, alertaram os fabricantes de automóveis europeus.

No mês passado, as autoridades europeias apresentaram um pacote de projetos de lei com o…

1 hora atrás

Jogos

“Lordes Capitães, ouvimos seus comentários”: A Owlcat Games removeu o inicializador de Warhammer 40.000: Rogue Trader um dia após o lançamento.

A Owlcat Games, um estúdio cipriota com raízes russas, anunciou o recolhimento do seu Owlcat…

1 hora atrás

Redes sociais

A Meta enfrenta multas bilionárias na União Europeia por incitar o vício em redes sociais entre adolescentes.

Em maio de 2024, a Comissão Europeia iniciou uma investigação sobre as Meta✴Platforms, levantando a…

1 hora atrás

Clientes de MI

Shah Shah, CEO do WhatsApp e fundador da startup indiana de tecnologia financeira, deixará o cargo.

Will Cathcart, que liderou o WhatsApp nos últimos sete anos, assumirá outra posição na Meta✴,…

1 hora atrás

Navegadores

O Firefox Mobile agora oferece resumo da página ao agitar seu smartphone.

A Mozilla lançou a atualização mais recente do navegador Firefox, a versão 152.0. Uma das…

2 horas atrás