Meta revela modelos de IA da família Llama 4 e os incorpora no WhatsApp e Instagram

A Meta✴ Platforms anunciou o lançamento da família Llama 4 de modelos de IA de código aberto. A família inclui Llama 4 Scout, Maverick e Behemoth, que permitem interação multimodal, ou seja, são capazes de responder não apenas a consultas de texto, mas também a processar imagens, vídeos, etc. Eles foram treinados em “grandes quantidades de dados de texto, imagem e vídeo não rotulados” para fornecer “ampla compreensão visual”.

Inteligência Artificial: Steve Johnson / Unsplash

O sucesso dos modelos de IA da empresa chinesa DeepSeek, que apresentam desempenho igual ou superior ao das gerações anteriores dos principais algoritmos da Llama, levou a Meta✴ a acelerar seu processo de desenvolvimento nessa direção. De acordo com a fonte, os funcionários da empresa estão se esforçando muito para entender como a DeepSeek conseguiu reduzir o custo de desenvolvimento e lançamento de modelos de IA, como R1 e V3.

Fonte da imagem: Meta✴

O algoritmo Llama 4 Scout tem 17 bilhões de parâmetros ativos, 16 “especialistas” e 109 bilhões de parâmetros no total. De acordo com o Meta✴, o modelo de IA supera o Gemma 3, o Gemini 2.0 Flash-Lite e o Mistral 3.1 no processamento de diferentes tipos de tarefas. Uma das principais características do modelo é o suporte a uma janela de contexto de 10 milhões de tokens.

O Llama 4 Maverick tem 17 bilhões de parâmetros ativos e 128 “especialistas” (400 bilhões de parâmetros no total). De acordo com os desenvolvedores, o modelo supera o GPT-4o e o Gemini 2.0 Flash quando testado em vários benchmarks, e também mostra resultados comparáveis ​​ao DeepSeek V3 no raciocínio e no processo de escrita de código de programa. O Scout pode ser executado em uma única GPU Nvidia H100, enquanto o Maverick requer um sistema Nvidia H100 DGX ou equivalente.

O modelo Llama 4 Behemoth tem 288 bilhões de parâmetros ativos e 16 “especialistas” (cerca de 2 trilhões de parâmetros no total) e supera o algoritmo GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro em vários benchmarks. O modelo Llama 4 Behemoth ainda está em aprendizado, por isso ainda não está disponível publicamente. Enquanto isso, os modelos Scout e Maverick estão disponíveis no Llama.com e no Hugging Face. Além disso, o assistente de IA proprietário da empresa, Meta✴ AI, disponível nos aplicativos da empresa, como WhatsApp, Messenger e Instagram✴, foi migrado para funcionar com o Llama 4 em 40 países ao redor do mundo. A capacidade de lidar com consultas multimodais está atualmente limitada ao inglês e está disponível apenas nos EUA.

Fonte da imagem: Meta✴

«Os modelos Llama 4 marcam o início de uma nova era para o ecossistema Llama. Este é apenas o começo para a família Llama 4″, disse a Meta✴ em uma postagem de blog. A empresa afirma que o Llama 4 é o primeiro grupo de modelos de IA a usar uma arquitetura de mistura de especialistas (MoE) que é mais eficiente em treinamento e inferência. A arquitetura MoE permite que o algoritmo divida tarefas em subtarefas e, em seguida, delegue seu processamento a modelos “especialistas” menores e mais especializados.

Vale ressaltar que nenhum dos modelos do Llama 4 são modelos de “raciocínio” adequados, como o GPT-o1 ou o GPT-o3-mini da OpenAI. Os modelos de raciocínio verificam a validade de suas respostas e tendem a ter respostas mais confiáveis, mas demoram mais para serem obtidas do que os modelos tradicionais “sem raciocínio”.

avalanche

Postagens recentes

A Qualcomm espera faturar US$ 15 bilhões por ano com a venda de chips para servidores até 2029.

O relatório trimestral da Qualcomm veio acompanhado do anúncio dos processadores de servidor Dragonfly C1000,…

2 horas atrás

Uma versão reforçada do cão robô chinês Lynx M20S escalou encostas de montanhas em temperaturas de -30 graus.

A empresa chinesa DEEP Robotics demonstrou a incrível resistência e capacidade de transposição de terrenos…

8 horas atrás

O aclamado simulador de sobrevivência DayZ ganhará uma sequência – a Bohemia Interactive anunciou oficialmente DayZ 2.

Os desenvolvedores do estúdio tcheco Bohemia Interactive confirmaram o desenvolvimento de uma sequência para o…

10 horas atrás

Em busca de férmions de Majorana: cientistas questionam novamente a tecnologia de computação quântica da Microsoft.

Uma nova crítica publicada na revista científica Nature levanta questões sobre o avanço da computação…

10 horas atrás

A Zoox atualizou seu serviço de robotáxis, com o lançamento do transporte público pago previsto para o final do ano.

A Zoox, empresa pertencente à Amazon, atualizou o design de seu robotáxi especializado. A Zoox…

12 horas atrás

Warhammer 40.000: Rogue Trader atingiu um novo pico de vendas e chegará ao formato físico pela primeira vez.

Após o fracasso do Owlcat Launcher, a Owlcat Games anunciou o sucesso de seu jogo…

12 horas atrás