Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O Google apresentou um modelo de IA de código aberto muito rápido chamado DiffusionGemma, que é fundamentalmente diferente dos demais.

O Google lançou um modelo experimental de inteligência artificial, o DiffusionGemma, que utiliza uma abordagem fundamentalmente diferente para a geração de texto em comparação com os modelos que alimentam a maioria dos chatbots modernos.

Fonte da imagem: blog.google

Em vez de gerar palavras palavra por palavra em uma sequência estrita, o DiffusionGemma cria um bloco inteiro de texto de uma só vez e continua a refiná-lo até que se torne legível. A principal vantagem do DiffusionGemma é priorizar a velocidade, mesmo que isso signifique alguma perda de qualidade. O modelo é publicado como código aberto sob a licença Apache 2.0 e é voltado para desenvolvedores e pesquisadores, não para usuários comuns.

Ele começa a responder às consultas do usuário com um conjunto de tokens aleatórios — texto ruidoso e ilegível — que são transformados em texto significativo ao longo de várias etapas. Isso aumenta significativamente a velocidade em comparação com os métodos tradicionais: 1000 tokens por segundo são gerados em um acelerador Nvidia H100, enquanto 700 tokens por segundo são gerados em uma placa de vídeo comum.

O Google DiffusionGemma possui uma arquitetura de Mistura de Especialistas (Mixture-of-Experts), o que significa que, de um total de 26 bilhões de parâmetros, apenas 3,8 bilhões estão ativos por vez; o modelo requer cerca de 18 GB de memória de vídeo. Ele gera 256 tokens por etapa, todos interagindo dentro de um bloco. Isso proporciona ao modelo uma visão global dos resultados, em vez de uma visão estritamente linear.

É ideal para tarefas de estruturação ou seguimento de regras: pode ser usado para preencher fragmentos de código ausentes, trabalhar com formatos como JSON, resolver problemas lógicos complexos e processar padrões matemáticos. Ao visualizar um bloco de tokens de uma só vez, ele pode corrigir inconsistências em um único ciclo de geração, em vez de esperar que um token posterior corrija o erro.

Mas ele temUma desvantagem significativa. As respostas do Google DiffusionGemma são de qualidade inferior às do Gemma 4 — o usuário troca velocidade por precisão. Portanto, o Google posiciona o projeto como experimental — ele foi desenvolvido para cenários em que a velocidade de resposta é mais importante do que a perfeição. Por exemplo, para aplicações de IA em tempo real, assistentes integrados de escrita de texto ou código e outros fluxos de trabalho rápidos e iterativos. Ele não se destina a substituir os modelos Gemma e Gemini.

admin

Próximo O ChatGPT pode ficar mais barato, já que a OpenAI planeja intensificar sua luta contra a Anthropic. »

Anterior « A Vertiv apresentou o Rack Extreme, um rack para servidores que suporta mais de 2.000 kg de equipamentos.

Deixar comentário

Publicado por

admin

3 semanas atrás

Postagens recentes

Jogos

Os desenvolvedores de Subnautica 2 finalmente receberão os bônus em dinheiro que merecem da Krafton, e o antigo novo CEO está deixando o estúdio novamente.

O sucesso do simulador de sobrevivência Subnautica 2, da Unknown Worlds Entertainment (UW), empresa americana…

1 hora atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Os jogadores que usam Claude receberam o retorno de Fable 5 com uma onda de críticas devido às novas restrições.

Após um hiato de quase três semanas devido a restrições do governo dos EUA, os…

1 hora atrás

Comentários sobre eventos recentes

Funcionários da Supermicro presos em Taiwan por contrabando de chips da Nvidia para a China.

Dois funcionários da Supermicro foram detidos em Taiwan no âmbito de uma investigação sobre o…

2 horas atrás

Coisas interessantes do mundo da alta tecnologia

Os iPhones foram responsabilizados pela queda nas taxas de natalidade, alegando-se que eles “desempenharam um papel significativo” na redução das gravidezes não planejadas nos EUA.

O Escritório Nacional de Pesquisa Econômica dos EUA conduziu uma análise estatística que encontrou uma…

2 horas atrás

Programas

A Samsung encerrará seu aplicativo de mensagens em favor de um similar ao do Google ainda este mês.

Conforme anunciado no início deste ano, o Samsung Messages, o aplicativo de mensagens, deixará de…

2 horas atrás

Monitores, projetores, sintonizadores de TV, televisões

A Acer apresentou o monitor gamer Nitro XV273U F5 de 27 polegadas com overclock de até 1000 Hz por US$ 700.

A Acer apresentou o monitor gamer Nitro XV273U F5 de 27 polegadas, que suporta dois…

2 horas atrás