Categorias: Programas

A gigante chinesa Meituan revelou seu modelo de IA de código aberto, LongCat-2.0, com 1,6 trilhão de parâmetros, treinado exclusivamente em chips chineses.

A gigante chinesa de entrega de comida Meituan anunciou o lançamento de seu modelo de linguagem de código aberto e de grande escala, o LongCat-2.0. A empresa afirmou que este é o primeiro modelo de IA com um trilhão de parâmetros, treinado usando um conjunto de 50.000 aceleradores de IA fabricados na China.

Fonte da imagem: Ricardo / unsplash.com

A empresa não divulgou exatamente como o novo modelo de IA LongCat-2.0 será integrado aos processos de negócios. A versão anterior do sistema era usada para alimentar assistentes de IA nos aplicativos da Meituan, gerando recomendações de restaurantes e hotéis, além de realizar diversas tarefas, como fazer pedidos de comida e reservar quartos de hotel. Em meio à queda nos lucros, a Meituan pode estar buscando maneiras de diversificar suas fontes de receita. Em uma publicação na conta oficial da LongCat no WeChat, a empresa destacou a capacidade do novo modelo de IA de criar um site de jogos e escrever um romance.

O uso de aceleradores de IA nacionais para treinar o modelo LongCat-2.0 ressalta a crescente importância da autossuficiência no mercado interno chinês. A Meituan, assim como outras grandes empresas de IA, como DeepSeek, Alibaba e ByteDance, está trabalhando para reduzir sua dependência de aceleradores de IA fabricados nos Estados Unidos, após a imposição de restrições de exportação americanas. Fabricantes locais de aceleradores de IA, como Huawei e Enflame, estão buscando preencher essa lacuna, conquistando participação de mercado por meio de contratos para fornecimento de hardware a desenvolvedores de IA.

Em relação ao modelo LongCat-2.0, a Meituan afirmou em um comunicado que a rede neural foi treinada do zero usando 50.000 aceleradores nacionais. O tamanho da janela de contexto é de 1 milhão de tokens, permitindo que a rede neural processe documentos extensos. O modelo é focado em programação baseada em agentes e sua arquitetura foi projetada para lidar com tarefas de geração de código de forma eficiente e eficaz.

As empresas observaram que a versão preliminar do LongCat-2.0 se tornou um dos três modelos mais utilizados na plataforma OpenRouter. De acordo com o Meituan, o novo modelo de IA apresenta desempenho igual ou superior a alguns dos principais modelos de empresas ocidentais, incluindo Google Gemini, OpenAI GPT-5.5 e Anthropic Claude Opus, em diversos benchmarks em termos de geração de código e capacidades baseadas em agentes.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Uma startup americana tornou-se a primeira no mundo a extrair eletricidade diretamente de uma reação de fusão nuclear.

A startup americana Realta Fusion anunciou uma demonstração de conversão direta de plasma em eletricidade…

18 minutos atrás

A Meta começará a cobrar por um recurso de óculos inteligentes que funciona sem seus servidores.

A Meta✴ anunciou discretamente que o recurso Foco na Conversa, integrado aos seus óculos inteligentes,…

31 minutos atrás

A Tesla contratou um veterano da Intel para chefiar sua gigantesca fábrica de chips em Terafab.

O fundador e CEO da SpaceX, Elon Musk, não escondeu seu desejo de colaborar com…

31 minutos atrás

Agora é possível definir a Alice AI como assistente de voz padrão no Android.

Agora é possível definir a Alice AI como assistente padrão em dispositivos Android e invocá-la…

43 minutos atrás

Trump lucrou US$ 1,2 bilhão com projetos de criptomoedas, enquanto seus investidores perderam dinheiro.

O presidente dos EUA, Donald Trump, lucrou quase US$ 1,2 bilhão com suas startups de…

56 minutos atrás

Tim Cook se juntou às negociações com a UE para salvar o lançamento de uma Siri com inteligência artificial mais inteligente.

Os legisladores europeus estão a moldar ativamente o quadro regulamentar no qual as empresas de…

56 minutos atrás