Apenas dois meses após o lançamento do grande modelo de linguagem Llama 3.1, Meta✴ apresentou sua versão atualizada Llama 3.2 – o primeiro sistema aberto de inteligência artificial que pode processar imagens e texto.
Fonte da imagem: Gerd Altmann / pixabay.com
Meta✴ Llama 3.2 permite aos desenvolvedores criar aplicações avançadas de IA: plataformas de realidade aumentada com reconhecimento de vídeo em tempo real; mecanismos de busca visual com classificação de imagens baseada em conteúdo; bem como sistemas de análise documental com elaboração de resumos de longos fragmentos de textos. Será muito simples para os desenvolvedores lançarem um novo modelo, dizem eles no Meta✴ – eles precisarão adicionar suporte para multimodalidade, “ser capaz de mostrar imagens de Llama e fazê-lo se comunicar”.
OpenAI e Google lançaram seus próprios modelos de IA multimodais no ano passado, então Meta✴ agora se encontra em uma posição de recuperação. O suporte de imagem é importante à medida que a Meta✴ continua a expandir os recursos de IA em todos os dispositivos, incluindo os óculos Ray-Ban Meta✴. O pacote Llama 3.2 inclui dois modelos que suportam o trabalho com imagens (com 11 e 90 bilhões de parâmetros) e dois modelos de texto leve (com 1 e 3 bilhões de parâmetros). Os menores são projetados para rodar em chips da Qualcomm, MediaTek e outros processadores Arm – a Meta✴ claramente espera que eles sejam usados em dispositivos móveis. Dito isto, o Llama 3.1, lançado em julho, ainda é uma oferta forte – uma versão tem 405 bilhões de parâmetros e deve superar as mais recentes na geração de texto.
No final de janeiro, foi noticiado que os smartphones da série Samsung Galaxy S26 provavelmente…
O minerador de dados Maxim Poletaev (também conhecido como Gabe Follower) comentou recentemente sobre rumores…
A Ford Motor, uma das maiores montadoras americanas, inicialmente se comprometeu com uma estreita cooperação…
Os longos tempos de carregamento são considerados uma das desvantagens operacionais dos veículos elétricos, mas…
Já se passaram mais de quatro anos desde o lançamento de ATOM RPG: Trudograd, e…
A mais recente viagem de Jensen Huang, CEO e fundador da Nvidia, a Taiwan incluiu,…