Meta revela modelos de IA da família Llama 4 e os incorpora no WhatsApp e Instagram

A Meta✴ Platforms anunciou o lançamento da família Llama 4 de modelos de IA de código aberto. A família inclui Llama 4 Scout, Maverick e Behemoth, que permitem interação multimodal, ou seja, são capazes de responder não apenas a consultas de texto, mas também a processar imagens, vídeos, etc. Eles foram treinados em “grandes quantidades de dados de texto, imagem e vídeo não rotulados” para fornecer “ampla compreensão visual”.

Inteligência Artificial: Steve Johnson / Unsplash

O sucesso dos modelos de IA da empresa chinesa DeepSeek, que apresentam desempenho igual ou superior ao das gerações anteriores dos principais algoritmos da Llama, levou a Meta✴ a acelerar seu processo de desenvolvimento nessa direção. De acordo com a fonte, os funcionários da empresa estão se esforçando muito para entender como a DeepSeek conseguiu reduzir o custo de desenvolvimento e lançamento de modelos de IA, como R1 e V3.

Fonte da imagem: Meta✴

O algoritmo Llama 4 Scout tem 17 bilhões de parâmetros ativos, 16 “especialistas” e 109 bilhões de parâmetros no total. De acordo com o Meta✴, o modelo de IA supera o Gemma 3, o Gemini 2.0 Flash-Lite e o Mistral 3.1 no processamento de diferentes tipos de tarefas. Uma das principais características do modelo é o suporte a uma janela de contexto de 10 milhões de tokens.

O Llama 4 Maverick tem 17 bilhões de parâmetros ativos e 128 “especialistas” (400 bilhões de parâmetros no total). De acordo com os desenvolvedores, o modelo supera o GPT-4o e o Gemini 2.0 Flash quando testado em vários benchmarks, e também mostra resultados comparáveis ​​ao DeepSeek V3 no raciocínio e no processo de escrita de código de programa. O Scout pode ser executado em uma única GPU Nvidia H100, enquanto o Maverick requer um sistema Nvidia H100 DGX ou equivalente.

O modelo Llama 4 Behemoth tem 288 bilhões de parâmetros ativos e 16 “especialistas” (cerca de 2 trilhões de parâmetros no total) e supera o algoritmo GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro em vários benchmarks. O modelo Llama 4 Behemoth ainda está em aprendizado, por isso ainda não está disponível publicamente. Enquanto isso, os modelos Scout e Maverick estão disponíveis no Llama.com e no Hugging Face. Além disso, o assistente de IA proprietário da empresa, Meta✴ AI, disponível nos aplicativos da empresa, como WhatsApp, Messenger e Instagram✴, foi migrado para funcionar com o Llama 4 em 40 países ao redor do mundo. A capacidade de lidar com consultas multimodais está atualmente limitada ao inglês e está disponível apenas nos EUA.

Fonte da imagem: Meta✴

«Os modelos Llama 4 marcam o início de uma nova era para o ecossistema Llama. Este é apenas o começo para a família Llama 4″, disse a Meta✴ em uma postagem de blog. A empresa afirma que o Llama 4 é o primeiro grupo de modelos de IA a usar uma arquitetura de mistura de especialistas (MoE) que é mais eficiente em treinamento e inferência. A arquitetura MoE permite que o algoritmo divida tarefas em subtarefas e, em seguida, delegue seu processamento a modelos “especialistas” menores e mais especializados.

Vale ressaltar que nenhum dos modelos do Llama 4 são modelos de “raciocínio” adequados, como o GPT-o1 ou o GPT-o3-mini da OpenAI. Os modelos de raciocínio verificam a validade de suas respostas e tendem a ter respostas mais confiáveis, mas demoram mais para serem obtidas do que os modelos tradicionais “sem raciocínio”.

avalanche

Postagens recentes

Cientistas chineses fizeram uma descoberta inovadora na gravação holográfica ultradensa.

Apesar das perspectivas promissoras, a gravação holográfica ainda não alcançou sucesso comercial. Gravar e decodificar…

23 minutos atrás

O jogo de tiro e terror Industria 2 foi adiado para 29 de abril, com os criadores prometendo trabalhar arduamente nas próximas duas semanas.

Os desenvolvedores da Bleakmill anunciaram que o jogo de tiro e terror atmosférico Industria 2…

37 minutos atrás

A viagem foi adiada: o simulador de viagens em trailer Outbound não será lançado em 23 de abril.

Os desenvolvedores do estúdio holandês Square Glade Games (Above Snakes) anunciaram o adiamento forçado do…

2 horas atrás

A Keychron apresentou o G3, um mouse gamer sem fio de 44g com hardware de ponta.

A Keychron é conhecida principalmente por seus teclados mecânicos, mas recentemente ganhou destaque no segmento…

2 horas atrás

“Vou dedicar toda a minha paixão, energia e alma a isso”: o filme de animação de Bloodborne está em boas mãos.

A blogueira irlandesa Sean McLoughlin, mais conhecida pelo pseudônimo Jacksepticeye, comentou o anúncio de um…

2 horas atrás

Os analistas estão confiantes de que a Apple não aumentará os preços dos Macs para atrair usuários de PCs.

Analistas acreditam que a Apple pode estar adotando uma política bastante atípica em busca de…

3 horas atrás