A rede neural chinesa WuDao 2.0 com 1,75 trilhão de parâmetros supera os análogos do Google e OpenAI

Cientistas chineses da Academia de Inteligência Artificial de Pequim (BAAI), junto com dezenas de colegas de outras organizações, criaram o modelo de processamento de linguagem natural (PNL) mais sofisticado do mundo que supera os do Google e OpenAI. A rede neural generativa de aprendizagem profunda WuDao 2.0 foi criada como parte do desejo da China de aumentar sua competitividade tecnológica no cenário global.

Imagem: Xinhua

WuDao 2.0 é um modelo de IA pré-treinado que usa 1,75 trilhão de parâmetros. Em comparação, o modelo GPT-3 da OpenAI usa 175 bilhões de parâmetros, enquanto o Google Switch Transformer apresentou em janeiro 1,6 bilhão de parâmetros. Os parâmetros são variáveis ​​definidas por modelos de aprendizado de máquina. À medida que o modelo se desenvolve, os parâmetros são refinados, seu número aumenta, o que aumenta a precisão do algoritmo e seu desempenho.

Os desenvolvedores mostraram como WuDao 2.0 usa seus recursos para simulação de fala, escrita de poesia, reconhecimento de imagem e geração de texto. De acordo com os dados disponíveis, o WuDao 2.0 foi treinado em inglês e chinês, para o qual os pesquisadores usaram 4,9 TB de imagens e texto, incluindo 1,2 TB de texto em inglês e chinês.

«Esses modelos complexos treinados em conjuntos de dados gigantescos requerem apenas uma pequena quantidade de novas informações para dominar uma função específica porque eles podem usar o que aprenderam para realizar novas tarefas ”, disse o cientista do BAAI Blake Yan.

avalanche

Postagens recentes

A NVIDIA investiu US$ 2 bilhões na Marvell, integrando-a ao seu ecossistema de IA e ao NVLink Fusion.

As ações da Marvell Technology subiram mais de 9% nas negociações pré-mercado após a NVIDIA…

26 minutos atrás

Corre o boato de que os desenvolvedores de Tomb Raider, e não de Kingdom Come: Deliverance 2, estão desenvolvendo um concorrente para Hogwarts Legacy no universo de O Senhor dos Anéis.

O estúdio americano Crystal Dynamics, pertencente ao Embracer Group, já está trabalhando em dois jogos…

26 minutos atrás

Hackers instalaram um Trojan em uma das bibliotecas JavaScript mais baixadas.

Hackers conseguiram comprometer a conta do desenvolvedor principal da biblioteca Axios no registro npm e…

2 horas atrás

O astronauta mais antigo da NASA causou alvoroço na internet com uma foto de um misterioso organismo roxo na Estação Espacial Internacional (ISS).

Recentemente, o astronauta mais antigo da NASA, Donald Pettit, publicou uma foto nas redes sociais…

2 horas atrás

O designer chefe da CI Games revelou a data de lançamento de Lords of the Fallen 2.

Enquanto os fãs aguardam a confirmação da data de lançamento do ambicioso RPG de ação…

2 horas atrás