O Google lançou o modelo de IA multimodal Gemma 4 12B, que funciona diretamente em um laptop.

O Google apresentou o Gemma 4 12B, um modelo de IA multimodal com recursos avançados de raciocínio lógico que pode ser executado de forma eficiente em laptops com 16 GB de RAM ou memória unificada.

Fonte da imagem: Google

De acordo com o blog da empresa, o modelo se posiciona como uma ponte entre o leve E4B e o mais avançado modelo 26B, baseado na arquitetura Mixture of Experts (MoE). Uma característica fundamental da arquitetura é a eliminação dos módulos separados de tradução de imagem e áudio antes de passá-los para o modelo de IA para processamento.

Em vez do codificador visual tradicional, agora é utilizado um módulo de incorporação compacto baseado em multiplicação e normalização de matrizes, permitindo que a arquitetura LLM lide com o processamento de dados visuais, reduzindo a carga sobre os recursos computacionais. Em relação ao áudio, esse processo foi ainda mais simplificado com a remoção completa do codificador de áudio e a projeção do sinal bruto em um único espaço com tokens de texto.

Ressalta-se que o novo sistema demonstra desempenho comparável à versão 26B, porém consome menos recursos do sistema, permitindo a resolução de problemas lógicos de múltiplos estágios e o suporte a cenários complexos de agentes de IA. A latência de resposta é ainda mais reduzida pela integração de mecanismos de Multi-Token Prediction (MTP).

O algoritmo é distribuído sob a licença de código aberto Apache 2.0 e é totalmente compatível com o ecossistema de desenvolvedores existente, que já baixou versões anteriores da plataforma Gemma 4 mais de 150 milhões de vezes. O processamento autônomo de dados de áudio pode ser avaliado usando o Google AI Edge Eloquent, um programa capaz de transcrever, formatar e traduzir comandos de voz sem conexão com a internet.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A SpaceX emitiu US$ 25 bilhões em títulos, com a demanda superando o volume da oferta em quase quatro vezes.

Embora alguns especialistas duvidassem ontem que a SpaceX conseguiria emitir US$ 20 bilhões em títulos,…

45 minutos atrás

Mais uma vítima de GTA VI: o jogo de ação RPG Lords of the Fallen 2 não será lançado no outono de 2026.

O ambicioso RPG de ação e fantasia Lords of the Fallen 2, da editora e…

57 minutos atrás

As ações da SpaceX caíram abaixo de US$ 150 pela primeira vez desde seu IPO.

Nos primeiros dias após o IPO, as ações da SpaceX subiram de forma constante, mas…

1 hora atrás

O preço dos chips da Nvidia homologados no mercado negro chinês mais que dobrou em seis meses.

Apesar dos esforços da Nvidia para fornecer à China aceleradores H100 especialmente adaptados, as autoridades…

2 horas atrás

Desenvolvedores de software chineses reclamaram aos órgãos reguladores sobre as taxas excessivamente altas na App Store da Apple.

Durante muitos anos, os desenvolvedores de software tiveram poucas opções se quisessem distribuir seus produtos…

3 horas atrás

A Disney considerou seriamente uma fusão com a Apple.

É geralmente aceito que a Walt Disney Company e a Apple compartilham apenas uma coisa:…

4 horas atrás