Pesquisadores da Microsoft anunciaram o desenvolvimento do maior modelo de bit único de inteligência artificial, uma abordagem arquitetônica chamada “bitnet”. O modelo BitNet b1.58 2B4T é de código aberto sob a licença MIT e requer apenas uma CPU, incluindo um Apple M2, para funcionar.

Os sistemas Bitnet são modelos compactados projetados para serem executados em hardware de baixo custo. No caso de modelos padrão, os pesos — os valores que determinam sua estrutura interna — são frequentemente quantizados. A quantização reduz o número de bits necessários para representar pesos, permitindo que os modelos sejam executados mais rapidamente em sistemas com menos memória. A Bitnet assume que os pesos são quantizados em três valores: “-1”, “0” e “1”, o que significa que, em teoria, tais modelos são muito mais eficientes em termos de memória e recursos de computação do que a maioria dos sistemas de IA modernos.

A Microsoft afirma que o BitNet b1.58 2B4T é o primeiro modelo baseado nessa arquitetura que tem 2 bilhões de parâmetros, e os parâmetros são em grande parte os mesmos que os pesos. Ele foi treinado em um conjunto de dados de 4 trilhões de tokens, o que é estimado como equivalente a cerca de 33 milhões de livros. O BitNet b1.58 2B4T está no mesmo nível de modelos de tamanho similar, superando o Meta✴ Llama 3.2 1B, o Google Gemma 3 1B e o Alibaba Qwen 2.5 1.5B nos testes GSM8K (matemática do ensino fundamental) e PIQA (avaliação de senso comum). Além disso, em alguns casos o modelo funciona duas vezes mais rápido que seus análogos e usa menos memória.

Mas há uma ressalva: para atingir o desempenho máximo, o modelo requer a estrutura bitnet.cpp desenvolvida pela Microsoft, que suporta apenas determinados hardwares. A lista de chips suportados não inclui processadores gráficos, sem os quais a indústria de IA moderna é impensável. Assim, a abordagem arquitetônica “bitnet” parece ser uma direção promissora, mas a compatibilidade de hardware ainda é um obstáculo.

avalanche

Postagens recentes

SMERSH: Wolf Hunter, o sucessor espiritual dos jogos de furtividade Death to Spies, foi anunciado.

A desenvolvedora Haggard Games (da série "Death to Spies") anunciou "SMERSH: Wolf Hunter", um jogo…

26 minutos atrás

A MSI apresenta um monitor 5K de 180Hz com retroiluminação Mini LED.

A MSI apresentou o MPG 271KRAW18, o primeiro monitor gamer Mini LED 5K do mundo…

26 minutos atrás

Hackers iranianos transformaram o ChatGPT e o Gemini em armas de guerra cibernética.

Enquanto políticos de todo o mundo tentam resolver a situação no Oriente Médio, a unidade…

4 horas atrás

Até 20 núcleos e gráficos equivalentes à RTX 5070: processadores Nvidia N1X e N1 Arm revelados

A Nvidia deverá apresentar sua família de processadores Arm N1 para laptops com Windows na…

6 horas atrás

A Sony apresentou seus mais recentes televisores de fabricação própria, e a TCL assumirá o posto em seguida.

Esta semana, o Grupo Sony apresentou duas televisões premium, que parecem ser os últimos modelos…

9 horas atrás