Yandex introduziu o YaLM 100B, a maior rede neural aberta para geração de texto

A empresa Yandex anunciou a rede neural YaLM 100B, projetada para gerar e processar textos em russo e inglês. Alega-se ser o maior modelo do mundo do tipo GPT (transformador pré-treinado generativo) publicado em domínio público até o momento.

Fonte da imagem: pixabay.com/geralt

O YaLM 100B contém 100 bilhões de parâmetros – mais do que qualquer um dos modelos existentes para o idioma russo. Graças a isso, a rede neural pode ser usada para resolver uma ampla gama de problemas relacionados ao processamento de linguagem natural.

Os modelos de linguagem da família YaLM determinam o princípio de construção de textos e geram novos com base nas leis da linguística e seu conhecimento do mundo. Qualquer tipo de texto é permitido: podem ser respostas, poemas, parabéns, etc. Além disso, os algoritmos são capazes de gerar ideias para campanhas publicitárias, criar descrições de produtos e vídeos e classificar textos.

Fonte da imagem: pixabay.com / Gerd Altmann

No processo de treinamento da rede, os supercomputadores Yandex, reconhecidos como os mais poderosos da Europa Oriental, estiveram envolvidos. O YaLM 100B processou cerca de 2 TB de textos de fontes abertas e da Internet em inglês e russo.

Agora a rede neural pode ser usada por desenvolvedores e pesquisadores de todo o mundo. O modelo é fornecido sob a licença aberta Apache 2.0 e está disponível no GitHub.

avalanche

Postagens recentes

O Bitcoin despencou para menos de US$ 67.000, com os investidores assustados e vendendo suas moedas.

O Bitcoin caiu para US$ 66.896,43 hoje, com o sentimento dos investidores se inclinando cada…

37 minutos atrás

A Intel desenvolveu uma nova geração de capacitores integrados — a chave para o fornecimento estável de energia para os chips de IA do futuro.

Ao discutirmos novas tecnologias de processo, constantemente mencionamos os transistores como componentes-chave que determinam o…

37 minutos atrás

The Elder Scrolls IV: Oblivion Remastered chegará ao Nintendo Switch 2, mas os fãs não estão exatamente entusiasmados.

Juntamente com as datas de lançamento das versões para Nintendo Switch 2 de Fallout 4…

1 hora atrás

Durov: O Telegram nunca compartilhou nenhum dado de nossas conversas e nunca compartilhará.

Ao longo de sua história, a administração do Telegram nunca compartilhou uma única informação sobre…

2 horas atrás

O Substack sofreu um vazamento de dados de usuários no outono, que só foi descoberto em fevereiro.

O Substack, um serviço popular que permite a blogueiros e jornalistas criar conteúdo e enviá-lo…

3 horas atrás