Apenas dois meses após o lançamento do grande modelo de linguagem Llama 3.1, Meta✴ apresentou sua versão atualizada Llama 3.2 – o primeiro sistema aberto de inteligência artificial que pode processar imagens e texto.

Fonte da imagem: Gerd Altmann / pixabay.com

Meta✴ Llama 3.2 permite aos desenvolvedores criar aplicações avançadas de IA: plataformas de realidade aumentada com reconhecimento de vídeo em tempo real; mecanismos de busca visual com classificação de imagens baseada em conteúdo; bem como sistemas de análise documental com elaboração de resumos de longos fragmentos de textos. Será muito simples para os desenvolvedores lançarem um novo modelo, dizem eles no Meta✴ – eles precisarão adicionar suporte para multimodalidade, “ser capaz de mostrar imagens de Llama e fazê-lo se comunicar”.

OpenAI e Google lançaram seus próprios modelos de IA multimodais no ano passado, então Meta✴ agora se encontra em uma posição de recuperação. O suporte de imagem é importante à medida que a Meta✴ continua a expandir os recursos de IA em todos os dispositivos, incluindo os óculos Ray-Ban Meta✴. O pacote Llama 3.2 inclui dois modelos que suportam o trabalho com imagens (com 11 e 90 bilhões de parâmetros) e dois modelos de texto leve (com 1 e 3 bilhões de parâmetros). Os menores são projetados para rodar em chips da Qualcomm, MediaTek e outros processadores Arm – a Meta✴ claramente espera que eles sejam usados ​​em dispositivos móveis. Dito isto, o Llama 3.1, lançado em julho, ainda é uma oferta forte – uma versão tem 405 bilhões de parâmetros e deve superar as mais recentes na geração de texto.

avalanche

Postagens recentes

Contra todas as expectativas: em resposta a vazamentos de jogabilidade, os desenvolvedores de 007 First Light revelaram os primeiros 13 minutos do jogo.

O jogo de ação e espionagem 007 First Light, do estúdio dinamarquês IO Interactive (da…

22 minutos atrás

O Pentágono divulgou 64 novos arquivos sobre OVNIs e prometeu continuar a divulgar o material.

O Pentágono divulgou um segundo conjunto de materiais desclassificados sobre objetos voadores não identificados (OVNIs)…

22 minutos atrás

BYD: Os carros com seu sistema de direção autônoma têm seis vezes menos probabilidade de se envolverem em acidentes graves do que aqueles com motoristas humanos.

As montadoras americanas e as desenvolvedoras de robotáxis são obrigadas a divulgar regularmente as estatísticas…

22 minutos atrás

Uma fonte interna revelou quando esperar The Elder Scrolls VI e Fallout 3 Remastered.

O aguardado RPG de fantasia The Elder Scrolls VI e os muito comentados relançamentos dos…

2 horas atrás

A China enviou uma nova tripulação para a estação orbital de Tiangong; um dos taikonautas permanecerá lá por 12 meses.

A espaçonave tripulada chinesa Shenzhou-23 acoplou-se com sucesso ao módulo principal da estação orbital chinesa…

2 horas atrás

Entusiastas aceleraram um drone a uma velocidade recorde de 733 km/h – ele quase alcançou um avião comercial.

Qualquer veículo inevitavelmente compete com outros em certas características e, no caso dos drones, a…

2 horas atrás