A rede neural chinesa WuDao 2.0 com 1,75 trilhão de parâmetros supera os análogos do Google e OpenAI

Cientistas chineses da Academia de Inteligência Artificial de Pequim (BAAI), junto com dezenas de colegas de outras organizações, criaram o modelo de processamento de linguagem natural (PNL) mais sofisticado do mundo que supera os do Google e OpenAI. A rede neural generativa de aprendizagem profunda WuDao 2.0 foi criada como parte do desejo da China de aumentar sua competitividade tecnológica no cenário global.

Imagem: Xinhua

WuDao 2.0 é um modelo de IA pré-treinado que usa 1,75 trilhão de parâmetros. Em comparação, o modelo GPT-3 da OpenAI usa 175 bilhões de parâmetros, enquanto o Google Switch Transformer apresentou em janeiro 1,6 bilhão de parâmetros. Os parâmetros são variáveis ​​definidas por modelos de aprendizado de máquina. À medida que o modelo se desenvolve, os parâmetros são refinados, seu número aumenta, o que aumenta a precisão do algoritmo e seu desempenho.

Os desenvolvedores mostraram como WuDao 2.0 usa seus recursos para simulação de fala, escrita de poesia, reconhecimento de imagem e geração de texto. De acordo com os dados disponíveis, o WuDao 2.0 foi treinado em inglês e chinês, para o qual os pesquisadores usaram 4,9 TB de imagens e texto, incluindo 1,2 TB de texto em inglês e chinês.

«Esses modelos complexos treinados em conjuntos de dados gigantescos requerem apenas uma pequena quantidade de novas informações para dominar uma função específica porque eles podem usar o que aprenderam para realizar novas tarefas ”, disse o cientista do BAAI Blake Yan.

avalanche

Postagens recentes

A escassez não é desculpa: Dell vs.

A Dell alertou as empresas contra a reutilização de SSDs em meio à grave escassez…

27 minutos atrás

A inteligência artificial chinesa está em ascensão: o ERNIE-5.0 da Baidu entrou para o top 10 mundial de modelos de inteligência artificial.

A gigante chinesa de tecnologia Baidu lançou uma nova versão de seu modelo de inteligência…

48 minutos atrás

A Nebulosa do Anel guarda uma surpresa que espera ser descoberta há 250 anos.

Uma equipe de astrônomos europeus fez uma descoberta inesperada enquanto estudava a Nebulosa do Anel…

1 hora atrás

A Asus reintegrou o botão ao mecanismo Q-Release Slim para evitar “confundir” os proprietários de placas gráficas.

A Asus mudou mais uma vez sua abordagem em relação ao mecanismo de ejeção da…

2 horas atrás

Veterano da Qualcomm se junta à Intel para desenvolver GPUs para servidores.

Os esforços da Intel para desenvolver processadores gráficos de alto desempenho têm sido contínuos há…

6 horas atrás