Apenas dois meses após o lançamento do grande modelo de linguagem Llama 3.1, Meta✴ apresentou sua versão atualizada Llama 3.2 – o primeiro sistema aberto de inteligência artificial que pode processar imagens e texto.

Fonte da imagem: Gerd Altmann / pixabay.com

Meta✴ Llama 3.2 permite aos desenvolvedores criar aplicações avançadas de IA: plataformas de realidade aumentada com reconhecimento de vídeo em tempo real; mecanismos de busca visual com classificação de imagens baseada em conteúdo; bem como sistemas de análise documental com elaboração de resumos de longos fragmentos de textos. Será muito simples para os desenvolvedores lançarem um novo modelo, dizem eles no Meta✴ – eles precisarão adicionar suporte para multimodalidade, “ser capaz de mostrar imagens de Llama e fazê-lo se comunicar”.

OpenAI e Google lançaram seus próprios modelos de IA multimodais no ano passado, então Meta✴ agora se encontra em uma posição de recuperação. O suporte de imagem é importante à medida que a Meta✴ continua a expandir os recursos de IA em todos os dispositivos, incluindo os óculos Ray-Ban Meta✴. O pacote Llama 3.2 inclui dois modelos que suportam o trabalho com imagens (com 11 e 90 bilhões de parâmetros) e dois modelos de texto leve (com 1 e 3 bilhões de parâmetros). Os menores são projetados para rodar em chips da Qualcomm, MediaTek e outros processadores Arm – a Meta✴ claramente espera que eles sejam usados ​​em dispositivos móveis. Dito isto, o Llama 3.1, lançado em julho, ainda é uma oferta forte – uma versão tem 405 bilhões de parâmetros e deve superar as mais recentes na geração de texto.

avalanche

Postagens recentes

Os computadores empresariais MSI Cubi NUC TWG, com refrigeração ativa e passiva, estão alojados em um gabinete de 0,55 litros.

A MSI apresentou os computadores de formato compacto Cubi NUC TWG, projetados para uso empresarial…

24 minutos atrás

A Rockstar confirmou um vazamento de dados através da plataforma de análise de IA de terceiros, Anodot.

A Rockstar Games confirmou que dados corporativos foram comprometidos em decorrência de um ataque hacker…

10 horas atrás

O fundador da DeepSeek anunciou a data de lançamento do modelo principal V4.

O fundador da DeepSeek, Liang Wenfeng, confirmou durante uma reunião interna com funcionários que o…

10 horas atrás