“A China precisa de seu próprio OpenAI”: o criador do popular mecanismo de busca chinês postou um poderoso modelo AI Baichuan-13B

Em fevereiro, o fundador do serviço de busca chinês Sogou (parte da Tencent), Wang Xiaochuan, escreveu na rede social Weibo que “a China precisa de sua própria OpenAI”. O empresário não atrasou a implementação do plano – sua startup Baichuan Intelligence criou e disponibilizou ao público um grande modelo de linguagem de inteligência artificial Baichuan-13B.

Fonte da imagem: Gerd Altmann / pixabay.com

A Baichuan é considerada uma das desenvolvedoras mais promissoras de grandes modelos de linguagem da China, fundada por um graduado da Universidade de Tsinghua que criou o serviço de busca Sogou, que mais tarde foi adquirido pela gigante tecnológica local Tencent. Wang deixou Sogou no final de 2021. Quando a plataforma ChatGPT já era sensação mundial, o empresário lançou a startup Baichuan e prontamente levantou investimentos de US$ 50 milhões.

Como o nome indica, o grande modelo de linguagem Baichuan-13B treinado em chinês e inglês na arquitetura Transformer (também subjacente ao GPT) possui 13 bilhões de parâmetros – variáveis ​​que são usadas na geração de texto. O código-fonte da plataforma é postado no GitHub e otimizado para uso comercial. Baichuan-13B foi treinado em 1,4 trilhão de tokens – para comparação, o modelo Meta* LlaMa com os mesmos 13 bilhões de parâmetros foi treinado em 1 trilhão de tokens.

A startup Baichuan está crescendo em um ritmo incrível. A empresa, inaugurada em abril, ampliou sua equipe para 50 pessoas até o final do mês e, em junho, publicou o primeiro grande modelo de linguagem Baichuan-7B com 7 bilhões de parâmetros. O novo Baichuan-13B está disponível gratuitamente para cientistas e desenvolvedores que receberam permissão para usá-lo para fins comerciais. Vale ressaltar que os criadores levaram em consideração as sanções antichinesas impostas pelos Estados Unidos, e o modelo pode rodar em sistemas com componentes de consumo, incluindo placas de vídeo NVIDIA GeForce RTX 3090.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal tomou uma decisão final para liquidar ou proibir atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

Life is Strange: Reunion – O desespero leva ao sucesso. Análise / Jogos

Jogado no PlayStation 5 Quando Life is Strange: Double Exposure foi lançado, parecia que a…

3 horas atrás

O diretor criativo da Naughty Dog deixou os fãs curiosos com uma foto de sua viagem de negócios — a imagem parece ser uma prévia de Uncharted 5.

Lançados em 2016 e 2017, Uncharted 4: A Thief's End e Uncharted: The Lost Legacy…

5 horas atrás

O avião sem leme X-65 da Boeing está um passo mais perto de voar — ele será controlado por correntes de ar.

A Aurora Flight Sciences, subsidiária da Boeing, anunciou um marco importante no projeto da aeronave…

6 horas atrás

Atualmente, a memória representa até 30% dos custos de construção de data centers — quatro vezes mais do que em 2023.

Os analistas da SemiAnalysis estimam que a memória representará aproximadamente 30% do investimento total de…

6 horas atrás

A Terra é visível pela vigia: o comandante da missão lunar Artemis II enviou fotos deslumbrantes do nosso planeta.

Há algumas horas, a espaçonave Orion e sua tripulação concluíram com sucesso uma manobra de…

6 horas atrás

A MSI lançou o adaptador PCIe sem fio Herald BE9400 com suporte para Wi-Fi 7 e Bluetooth 5.4.

A MSI lançou o adaptador sem fio Herald BE9400 como uma placa de expansão PCIe,…

6 horas atrás