“A China precisa de seu próprio OpenAI”: o criador do popular mecanismo de busca chinês postou um poderoso modelo AI Baichuan-13B

Em fevereiro, o fundador do serviço de busca chinês Sogou (parte da Tencent), Wang Xiaochuan, escreveu na rede social Weibo que “a China precisa de sua própria OpenAI”. O empresário não atrasou a implementação do plano – sua startup Baichuan Intelligence criou e disponibilizou ao público um grande modelo de linguagem de inteligência artificial Baichuan-13B.

Fonte da imagem: Gerd Altmann / pixabay.com

A Baichuan é considerada uma das desenvolvedoras mais promissoras de grandes modelos de linguagem da China, fundada por um graduado da Universidade de Tsinghua que criou o serviço de busca Sogou, que mais tarde foi adquirido pela gigante tecnológica local Tencent. Wang deixou Sogou no final de 2021. Quando a plataforma ChatGPT já era sensação mundial, o empresário lançou a startup Baichuan e prontamente levantou investimentos de US$ 50 milhões.

Como o nome indica, o grande modelo de linguagem Baichuan-13B treinado em chinês e inglês na arquitetura Transformer (também subjacente ao GPT) possui 13 bilhões de parâmetros – variáveis ​​que são usadas na geração de texto. O código-fonte da plataforma é postado no GitHub e otimizado para uso comercial. Baichuan-13B foi treinado em 1,4 trilhão de tokens – para comparação, o modelo Meta* LlaMa com os mesmos 13 bilhões de parâmetros foi treinado em 1 trilhão de tokens.

A startup Baichuan está crescendo em um ritmo incrível. A empresa, inaugurada em abril, ampliou sua equipe para 50 pessoas até o final do mês e, em junho, publicou o primeiro grande modelo de linguagem Baichuan-7B com 7 bilhões de parâmetros. O novo Baichuan-13B está disponível gratuitamente para cientistas e desenvolvedores que receberam permissão para usá-lo para fins comerciais. Vale ressaltar que os criadores levaram em consideração as sanções antichinesas impostas pelos Estados Unidos, e o modelo pode rodar em sistemas com componentes de consumo, incluindo placas de vídeo NVIDIA GeForce RTX 3090.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal tomou uma decisão final para liquidar ou proibir atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

Mais quadros, mais latência: Teste de latência com geração de quadros DLSS e FSR / Placas de vídeo

Desde que as placas de vídeo para jogos existem, conhecemos uma medida definitiva do seu…

48 minutos atrás

O iPad dobrável corre o risco de nunca ser lançado devido à promoção de Ternus ao cargo de CEO da Apple.

Nos últimos anos, circularam rumores de que a Apple, além do iPhone dobrável, estaria desenvolvendo…

1 hora atrás

O jogo de tiro com temática de evacuação Arc Raiders receberá amanhã a grande atualização Riven Tides, que trará um novo mapa e diversas atividades.

A Embark Studios divulgou um trailer da grande atualização Riven Tides para seu jogo de…

2 horas atrás

A Valve anunciou o lançamento do Steam Controller, que de fato custa US$ 99.

A Valve anunciou oficialmente que as vendas do Steam Controller começarão em 4 de maio.…

3 horas atrás

Fonte interna: Ubisoft ameaçou demitir 50 desenvolvedores de Assassin’s Creed Codename Hexe para manter o orçamento sob controle.

Tom Henderson, uma fonte confiável, compartilhou novos detalhes dos bastidores sobre o RPG de ação…

3 horas atrás