“A China precisa de seu próprio OpenAI”: o criador do popular mecanismo de busca chinês postou um poderoso modelo AI Baichuan-13B

Em fevereiro, o fundador do serviço de busca chinês Sogou (parte da Tencent), Wang Xiaochuan, escreveu na rede social Weibo que “a China precisa de sua própria OpenAI”. O empresário não atrasou a implementação do plano – sua startup Baichuan Intelligence criou e disponibilizou ao público um grande modelo de linguagem de inteligência artificial Baichuan-13B.

Fonte da imagem: Gerd Altmann / pixabay.com

A Baichuan é considerada uma das desenvolvedoras mais promissoras de grandes modelos de linguagem da China, fundada por um graduado da Universidade de Tsinghua que criou o serviço de busca Sogou, que mais tarde foi adquirido pela gigante tecnológica local Tencent. Wang deixou Sogou no final de 2021. Quando a plataforma ChatGPT já era sensação mundial, o empresário lançou a startup Baichuan e prontamente levantou investimentos de US$ 50 milhões.

Como o nome indica, o grande modelo de linguagem Baichuan-13B treinado em chinês e inglês na arquitetura Transformer (também subjacente ao GPT) possui 13 bilhões de parâmetros – variáveis ​​que são usadas na geração de texto. O código-fonte da plataforma é postado no GitHub e otimizado para uso comercial. Baichuan-13B foi treinado em 1,4 trilhão de tokens – para comparação, o modelo Meta* LlaMa com os mesmos 13 bilhões de parâmetros foi treinado em 1 trilhão de tokens.

A startup Baichuan está crescendo em um ritmo incrível. A empresa, inaugurada em abril, ampliou sua equipe para 50 pessoas até o final do mês e, em junho, publicou o primeiro grande modelo de linguagem Baichuan-7B com 7 bilhões de parâmetros. O novo Baichuan-13B está disponível gratuitamente para cientistas e desenvolvedores que receberam permissão para usá-lo para fins comerciais. Vale ressaltar que os criadores levaram em consideração as sanções antichinesas impostas pelos Estados Unidos, e o modelo pode rodar em sistemas com componentes de consumo, incluindo placas de vídeo NVIDIA GeForce RTX 3090.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal tomou uma decisão final para liquidar ou proibir atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

Robôs de batalha do Atomic Heart invadiram o War Thunder por três semanas para participar de um evento único

Alguns meses atrás, a Gaijin Entertainment anunciou que o filme de ação competitivo free-to-play War…

2 horas atrás

IA dominará o design de chips, previu Lisa Su

A inteligência artificial está cada vez mais sendo introduzida no processo de design de chips,…

2 horas atrás

AMD Ryzen 5 7500F estará à venda até o final deste mês, mas apenas na China

O processador AMD Ryzen 5 7500F vazado regularmente estará à venda até o final deste…

2 horas atrás

Samsung permitirá uso gratuito de mais de 100 tecnologias patenteadas para pequenas empresas

A Samsung Electronics, como parte de um acordo com as autoridades sul-coreanas, permitirá que pequenas…

2 horas atrás

Threads poderão gerar receita anual de US$ 8 bilhões em dois anos

A nova plataforma de microblogging Threads, lançada na semana passada pela Meta*, pode trazer muito…

2 horas atrás

O elétron é negado ter uma forma oval – ainda é uma “bola”, um novo estudo mostrou

Cientistas da Universidade do Colorado estabeleceram os limites mais rigorosos até o momento para a…

2 horas atrás