Pesquisadores da Microsoft anunciaram o desenvolvimento do maior modelo de bit único de inteligência artificial, uma abordagem arquitetônica chamada “bitnet”. O modelo BitNet b1.58 2B4T é de código aberto sob a licença MIT e requer apenas uma CPU, incluindo um Apple M2, para funcionar.

Os sistemas Bitnet são modelos compactados projetados para serem executados em hardware de baixo custo. No caso de modelos padrão, os pesos — os valores que determinam sua estrutura interna — são frequentemente quantizados. A quantização reduz o número de bits necessários para representar pesos, permitindo que os modelos sejam executados mais rapidamente em sistemas com menos memória. A Bitnet assume que os pesos são quantizados em três valores: “-1”, “0” e “1”, o que significa que, em teoria, tais modelos são muito mais eficientes em termos de memória e recursos de computação do que a maioria dos sistemas de IA modernos.

A Microsoft afirma que o BitNet b1.58 2B4T é o primeiro modelo baseado nessa arquitetura que tem 2 bilhões de parâmetros, e os parâmetros são em grande parte os mesmos que os pesos. Ele foi treinado em um conjunto de dados de 4 trilhões de tokens, o que é estimado como equivalente a cerca de 33 milhões de livros. O BitNet b1.58 2B4T está no mesmo nível de modelos de tamanho similar, superando o Meta✴ Llama 3.2 1B, o Google Gemma 3 1B e o Alibaba Qwen 2.5 1.5B nos testes GSM8K (matemática do ensino fundamental) e PIQA (avaliação de senso comum). Além disso, em alguns casos o modelo funciona duas vezes mais rápido que seus análogos e usa menos memória.

Mas há uma ressalva: para atingir o desempenho máximo, o modelo requer a estrutura bitnet.cpp desenvolvida pela Microsoft, que suporta apenas determinados hardwares. A lista de chips suportados não inclui processadores gráficos, sem os quais a indústria de IA moderna é impensável. Assim, a abordagem arquitetônica “bitnet” parece ser uma direção promissora, mas a compatibilidade de hardware ainda é um obstáculo.

avalanche

Postagens recentes

Um GIF da Rachel dançando, da série Friends, cresceu para centenas de gigabytes e corrompeu os backups do Discourse.

O Discourse é uma plataforma de discussão amplamente utilizada que atualmente suporta mais de 22.000…

1 hora atrás

A maioria dos adolescentes australianos continuou a usar as redes sociais apesar da proibição.

Segundo uma pesquisa com mais de mil crianças e adolescentes australianos, aproximadamente 61% dos adolescentes…

2 horas atrás

Hackers da Rockstar vão publicar dados roubados depois que a desenvolvedora de GTA VI se recusou a atender às exigências dos hackers.

O grupo de hackers ShinyHunters, que obteve acesso a informações confidenciais da Rockstar Games, desenvolvedora…

2 horas atrás

A Microsoft lançou o cursor de mouse virtual Gamepad para consoles portáteis com Windows.

A Microsoft começou a testar seu próprio cursor de mouse virtual para o modo Xbox…

2 horas atrás

A Microsoft confirmou a apresentação do novo jogo Metro – onde e quando assistir ao Xbox First Look: Metro 2039

Após uma série de rumores, a provedora americana de jogos Xbox confirmou seus planos de…

3 horas atrás