Pesquisadores da Microsoft anunciaram o desenvolvimento do maior modelo de bit único de inteligência artificial, uma abordagem arquitetônica chamada “bitnet”. O modelo BitNet b1.58 2B4T é de código aberto sob a licença MIT e requer apenas uma CPU, incluindo um Apple M2, para funcionar.

Os sistemas Bitnet são modelos compactados projetados para serem executados em hardware de baixo custo. No caso de modelos padrão, os pesos — os valores que determinam sua estrutura interna — são frequentemente quantizados. A quantização reduz o número de bits necessários para representar pesos, permitindo que os modelos sejam executados mais rapidamente em sistemas com menos memória. A Bitnet assume que os pesos são quantizados em três valores: “-1”, “0” e “1”, o que significa que, em teoria, tais modelos são muito mais eficientes em termos de memória e recursos de computação do que a maioria dos sistemas de IA modernos.

A Microsoft afirma que o BitNet b1.58 2B4T é o primeiro modelo baseado nessa arquitetura que tem 2 bilhões de parâmetros, e os parâmetros são em grande parte os mesmos que os pesos. Ele foi treinado em um conjunto de dados de 4 trilhões de tokens, o que é estimado como equivalente a cerca de 33 milhões de livros. O BitNet b1.58 2B4T está no mesmo nível de modelos de tamanho similar, superando o Meta✴ Llama 3.2 1B, o Google Gemma 3 1B e o Alibaba Qwen 2.5 1.5B nos testes GSM8K (matemática do ensino fundamental) e PIQA (avaliação de senso comum). Além disso, em alguns casos o modelo funciona duas vezes mais rápido que seus análogos e usa menos memória.

Mas há uma ressalva: para atingir o desempenho máximo, o modelo requer a estrutura bitnet.cpp desenvolvida pela Microsoft, que suporta apenas determinados hardwares. A lista de chips suportados não inclui processadores gráficos, sem os quais a indústria de IA moderna é impensável. Assim, a abordagem arquitetônica “bitnet” parece ser uma direção promissora, mas a compatibilidade de hardware ainda é um obstáculo.

avalanche

Postagens recentes

A MCST recebeu um lote de 10.000 processadores Elbrus-2S3.

Em 2025, a empresa privada russa MCST recebeu mais de 10.000 processadores Elbrus-2S3 de um…

3 horas atrás

A OpenAI investe US$ 500 milhões na unidade de energia da SoftBank, a SB Energy.

O OpenAI Group está investindo US$ 500 milhões na SB Energy, uma subsidiária do SoftBank…

10 horas atrás

A AMD superou a Nvidia por 210 a 120 em menções à IA na apresentação da CES 2026.

Na CES 2026, realizada esta semana em Las Vegas, EUA, as tecnologias de IA foram…

10 horas atrás

O Windows 11 contará com uma maneira oficial de desinstalar o Copilot.

Usuários com privilégios de administrador agora podem desinstalar o aplicativo Microsoft Copilot pré-instalado em dispositivos…

12 horas atrás

O aplicativo Microsoft Lens será completamente descontinuado em março de 2026.

A Microsoft descontinuou oficialmente o aplicativo Microsoft Lens para dispositivos iOS e Android, com efeito…

12 horas atrás

O smartphone modular Meizu 22 Air foi descontinuado devido ao aumento dos custos de memória.

A Meizu cancelou oficialmente o lançamento do Meizu 22 Air modular, anunciando a decisão durante…

12 horas atrás