Apenas dois meses após o lançamento do grande modelo de linguagem Llama 3.1, Meta✴ apresentou sua versão atualizada Llama 3.2 – o primeiro sistema aberto de inteligência artificial que pode processar imagens e texto.

Fonte da imagem: Gerd Altmann / pixabay.com

Meta✴ Llama 3.2 permite aos desenvolvedores criar aplicações avançadas de IA: plataformas de realidade aumentada com reconhecimento de vídeo em tempo real; mecanismos de busca visual com classificação de imagens baseada em conteúdo; bem como sistemas de análise documental com elaboração de resumos de longos fragmentos de textos. Será muito simples para os desenvolvedores lançarem um novo modelo, dizem eles no Meta✴ – eles precisarão adicionar suporte para multimodalidade, “ser capaz de mostrar imagens de Llama e fazê-lo se comunicar”.

OpenAI e Google lançaram seus próprios modelos de IA multimodais no ano passado, então Meta✴ agora se encontra em uma posição de recuperação. O suporte de imagem é importante à medida que a Meta✴ continua a expandir os recursos de IA em todos os dispositivos, incluindo os óculos Ray-Ban Meta✴. O pacote Llama 3.2 inclui dois modelos que suportam o trabalho com imagens (com 11 e 90 bilhões de parâmetros) e dois modelos de texto leve (com 1 e 3 bilhões de parâmetros). Os menores são projetados para rodar em chips da Qualcomm, MediaTek e outros processadores Arm – a Meta✴ claramente espera que eles sejam usados ​​em dispositivos móveis. Dito isto, o Llama 3.1, lançado em julho, ainda é uma oferta forte – uma versão tem 405 bilhões de parâmetros e deve superar as mais recentes na geração de texto.

avalanche

Postagens recentes

A Microsoft prometeu tornar o Windows 11 “mais tranquilo e calmo”.

A Microsoft confirmou que reduzirá o número de anúncios e recomendações no Windows 11 para…

3 horas atrás

A Nokia já está se preparando para o desenvolvimento do Wi-Fi 9.

A Nokia delineou sua visão para o futuro padrão sem fio Wi-Fi 9, projetado para…

8 horas atrás

A Apple não abandonou os planos de lançar um iPad mais acessível com o chip A18 nesta primavera.

Contrariando as expectativas, os anúncios da Apple em março não mencionaram um iPad básico com…

9 horas atrás

A LG iniciou a produção em massa de telas para laptops com taxa de atualização variável de 1 a 120 Hz.

A LG Display anunciou o início da produção em massa dos primeiros painéis LCD do…

11 horas atrás

A LG iniciou a produção em massa de telas para laptops com taxa de atualização variável de 1 a 120 Hz.

A LG Display anunciou o início da produção em massa dos primeiros painéis LCD do…

11 horas atrás

“Destruição do Patrimônio da Humanidade” – Astrônomos protestam contra data centers e espelhos no espaço.

Astrônomos estão soando o alarme, protestando contra a implementação de dois projetos de grande escala…

12 horas atrás