Categorias: Mercado de tecnologia e TI. notíciaRedes sociais

Meta nega inflar artificialmente os resultados do teste do modelo de IA Llama 4

Um representante da Meta✴ negou rumores de que a empresa melhorou intencionalmente o desempenho de seus novos modelos Llama 4 AI em benchmarks. O vice-presidente de IA generativa, Ahmad Al-Dahle, disse em uma publicação no X que as alegações de que os resultados foram manipulados para esconder fraquezas nos modelos Maverick e Scout “simplesmente não eram verdadeiras”.

Fonte da imagem: Mariia Shalabaieva/Unsplash

Boatos de manipulação surgiram nas redes sociais após uma publicação de um ex-funcionário da Meta✴. Um usuário de uma plataforma chinesa alegou que saiu da empresa em protesto contra “métodos de teste injustos”. Essas acusações mais tarde se espalharam para o X (antigo Twitter) e o Reddit, escreve o TechCrunch.

No entanto, Al-Dahle enfatizou que o Meta✴ não treinou os modelos Llama 4 Maverick e Llama 4 Scout em “conjuntos de dados de teste”, que são amostras especiais usadas para avaliar IA. Tal prática poderia inflar artificialmente os resultados, criando uma falsa impressão sobre as capacidades dos modelos.

As suspeitas surgiram inicialmente devido às diferenças na maneira como o Llama 4 Maverick funcionava em diferentes plataformas. Os pesquisadores notaram que a versão do modelo no benchmark LM Arena se comportou de forma diferente da versão disponível publicamente e não conseguiu lidar com certas tarefas. Além disso, o Meta✴ usou uma versão experimental do Maverick para melhorar os resultados de benchmark, o que também levantou questões.

Ao mesmo tempo, Al-Dahle observa que o motivo pelo qual os usuários estão atualmente enfrentando instabilidade na qualidade dos modelos pode estar relacionado às configurações dos provedores de nuvem em cujos servidores os scripts estão hospedados. “Lançamos os modelos assim que ficaram prontos e levará alguns dias para que todas as implementações públicas sejam configuradas de acordo com nossos requisitos”, explicou ele. A Meta✴ prometeu continuar trabalhando na correção de bugs do Llama 4 em qualquer caso para rápida integração dos desenvolvedores em seus projetos.

avalanche

Próximo Apple perde US$ 638 bilhões em capitalização em três dias; O preço do iPhone pode aumentar em US$ 350 nos EUA »

Anterior « "A IA está roubando de todos": indústria de mídia exige fim imediato ao roubo de conteúdo de IA

Deixar comentário

Publicado por

avalanche

11 meses atrás

Postagens recentes

Periféricos de áudio / vídeo, fones de ouvido, webcams

O primeiro dispositivo de IA da OpenAI será um alto-falante inteligente com câmera, capaz de reconhecer seu dono.

O primeiro produto de hardware da OpenAI será um alto-falante inteligente com câmera, que, segundo…

1 hora atrás

Jogos

“Um nos decepcionou. O outro nos rejeitou”: Um analista de dados encontrou indícios nos arquivos de God of War Ragnarok de que o novo Deus da Guerra irá para o Egito.

Os desenvolvedores do estúdio americano Santa Monica não têm pressa em revelar o futuro dos…

2 horas atrás

Jogos

“Um nos decepcionou. O outro nos rejeitou”: Um analista de dados encontrou indícios nos arquivos de God of War Ragnarok de que o novo Deus da Guerra irá para o Egito.

Os desenvolvedores do estúdio americano Santa Monica não têm pressa em revelar o futuro dos…

2 horas atrás

Jogos

A Ubisoft confirmou o desenvolvimento de dois jogos “muito promissores” da franquia Far Cry e vários jogos da série Assassin’s Creed, incluindo versões multiplayer.

Em entrevista à Variety, o cofundador e CEO da Ubisoft, Yves Guillemot, falou sobre o…

3 horas atrás

Sistemas operacionais

O Bloco de Notas está se tornando cada vez mais o WordPad — agora a Microsoft adicionou suporte a imagens.

O site Windows Latest noticiou que a Microsoft está adicionando suporte a imagens ao Bloco…

3 horas atrás

Espaço

A NASA finalmente concluiu um ensaio geral na água para o lançamento do foguete lunar SLS – agora é hora de começar.

Na manhã de hoje, a NASA concluiu um ensaio geral de dois dias para o…

3 horas atrás

Meta nega inflar artificialmente os resultados do teste do modelo de IA Llama 4

Conteúdo relacionado

Postagens recentes

O primeiro dispositivo de IA da OpenAI será um alto-falante inteligente com câmera, capaz de reconhecer seu dono.

“Um nos decepcionou. O outro nos rejeitou”: Um analista de dados encontrou indícios nos arquivos de God of War Ragnarok de que o novo Deus da Guerra irá para o Egito.

“Um nos decepcionou. O outro nos rejeitou”: Um analista de dados encontrou indícios nos arquivos de God of War Ragnarok de que o novo Deus da Guerra irá para o Egito.

A Ubisoft confirmou o desenvolvimento de dois jogos “muito promissores” da franquia Far Cry e vários jogos da série Assassin’s Creed, incluindo versões multiplayer.

O Bloco de Notas está se tornando cada vez mais o WordPad — agora a Microsoft adicionou suporte a imagens.

A NASA finalmente concluiu um ensaio geral na água para o lançamento do foguete lunar SLS – agora é hora de começar.