Intel, Arm e NVIDIA publicaram um rascunho da especificação de formato numérico FP8 para números de ponto flutuante de 8 bits. Conforme concebido pelas empresas, esse formato deve se tornar uma representação única dos números utilizados na resolução de problemas de IA tanto no treinamento de redes neurais quanto em sua operação (inferência).

Nvidia

Segundo as empresas, o uso de números reais de 8 bits no cálculo de pesos em redes neurais otimizará o uso de recursos de computação de hardware. Esses números ocupam menos memória e são mais fáceis de processar, o que aumentará o desempenho dos aceleradores de hardware ao resolver problemas de IA.

Os formatos tradicionais de ponto flutuante atualmente em uso são FP32 (precisão simples) e FP16 (meia precisão). Ao resolver problemas de aprendizado de máquina, o segundo formato agora é predominantemente usado. No entanto, de acordo com Intel, Arm e NVIDIA, números ainda mais curtos, embora com menor precisão, são bastante aplicáveis ​​em tarefas de IA, ao mesmo tempo em que podem ser processados ​​mais rapidamente e com menos energia.

Por exemplo, em uma postagem no blog, o diretor de marketing de produtos da NVIDIA, Shar Narasimhan, observa que o formato FP8 exibe “fidelidade comparável” à precisão de 16 bits em aplicativos como visão computacional e sistemas de imagem, enquanto fornece aceleração “significativa”.

O formato FP8 estará disponível para todos sem licença, em formato aberto. As especificações serão posteriormente submetidas ao IEEE, um órgão de padrões da indústria para várias áreas técnicas. “Acreditamos que a existência de um formato comum de troca de dados garantirá rápido progresso e compatibilidade de plataformas de hardware e software para o desenvolvimento de tecnologia de computação”, disse Narasimhan.

Vale ressaltar que o suporte para números FP8 já foi implementado na arquitetura GH100 Hopper da NVIDIA, bem como nos aceleradores Gaudi2 AI da Intel.

O formato unificado do FP8 beneficiará não apenas as três empresas que propuseram o padrão, mas também outros players que oferecem aceleradores para trabalhar com IA. De uma forma ou de outra, todos eles suportam algumas de suas versões de números de ponto flutuante de precisão reduzida, e o surgimento de um único padrão aberto em vez de vários formatos concorrentes simplificará o desenvolvimento de soluções de hardware e bibliotecas de software.

avalanche

Postagens recentes

O investimento da Microsoft na OpenAI ultrapassará os 100 bilhões de dólares no próximo mês.

Ao discutir anteriormente o financiamento da Microsoft à OpenAI, a referência usual era aos US$…

29 minutos atrás

O Google está desenvolvendo um recurso para tradução simultânea de fala sem conexão com a internet.

O Google fez avanços significativos na tecnologia de tradução automática, abrangendo inúmeros pares de idiomas…

1 hora atrás

A Apple ainda permitirá agentes de IA autônomos na App Store, mas com restrições.

A Apple está explorando a possibilidade de permitir agentes de IA autônomos na App Store,…

2 horas atrás

De acordo com a Anthropic, a IA será capaz de antecipar as necessidades dos usuários em um futuro próximo.

A diretora executiva da Anthropic, Cat Wu, anunciou a iminente transição dos sistemas de inteligência…

2 horas atrás

A China lançou um experimento com embriões humanos artificiais na estação orbital.

A China lançou o primeiro experimento orbital do mundo para estudar o desenvolvimento de embriões…

2 horas atrás

Pronto para a missão: o thriller de espionagem 007 First Light, dos criadores de Hitman, alcançou o status gold duas semanas antes do lançamento.

O ambicioso thriller de espionagem 007 First Light, da desenvolvedora dinamarquesa IO Interactive (da série…

9 horas atrás