Enquanto o mercado de IA dos EUA estava ocupado na semana passada estudando o impacto de ferramentas antrópicas e altruístas na programação e nos serviços financeiros, gigantes da tecnologia chinesas lançaram modelos de IA que demonstraram ganhos de desempenho em robótica e geração de vídeo. Alibaba, ByteDance (proprietária do TikTok) e a plataforma de vídeos curtos Kuaishou revelaram novos algoritmos, confirmando que os desenvolvedores chineses estão acompanhando o ritmo de seus colegas americanos.

Fonte da imagem: Gemini
O anúncio dos novos algoritmos das gigantes chinesas de tecnologia surge em meio a uma declaração recente de Demis Hassabis, chefe da divisão de IA DeepMind do Google, de que os modelos de IA chineses estão apenas alguns meses atrás de seus concorrentes ocidentais. No entanto, as ferramentas apresentadas na semana passada podem muito bem ser consideradas concorrentes diretas de modelos de IA para geração de vídeo, como o Sora da OpenAI, bem como de modelos de robótica da Nvidia e do Google.
A divisão de pesquisa da Alibaba, DAMO, anunciou o RynnBrain, um modelo de IA projetado para ajudar robôs a entender o mundo físico ao seu redor e identificar objetos. Em um vídeo de demonstração, a Alibaba mostrou um robô com garras no lugar das mãos colhendo laranjas e colocando-as em uma cesta. O robô também foi mostrado pegando leite de uma geladeira.
Os modelos de IA exigem treinamento extensivo para atingir seu objetivo de identificar e interagir com objetos do cotidiano. Isso significa que um processo tão simples para humanos quanto colher frutas é muito mais complexo para a robótica. Com o lançamento do RynnBrain, a Alibaba começará a competir com empresas como a Nvidia e o Google, que estão desenvolvendo seus próprios modelos de IA para robótica. Uma das principais inovações do modelo de IA é a sua percepção intrínseca de tempo e espaço. Em vez de simplesmente responder a estímulos imediatos, o robô consegue lembrar quando e onde os eventos ocorreram, acompanhar o progresso de uma tarefa e continuar a agir em várias etapas. Isso o torna mais confiável e consistente.”Em condições complexas do mundo real”, afirma Adina Yakefu, pesquisadora da Hugging Face. Ela acrescentou que o “objetivo maior” do Alibaba é “criar uma camada básica de inteligência para sistemas incorporados”.
Na semana passada, a ByteDance apresentou o Seedance 2.0, um modelo de IA para geração de vídeos capaz de criar vídeos realistas a partir de descrições textuais simples. O algoritmo também funciona com outros vídeos e imagens. Os vídeos de demonstração criados com o Seedance 2.0 parecem bastante realistas.

Fonte da imagem: Sony
Adina Yakefu confirmou que o modelo de IA Seedance 2.0 apresentou melhorias significativas em relação às versões anteriores em termos de “controlabilidade, velocidade e eficiência”. “O Seedance 2.0 é um dos modelos de geração de vídeo mais equilibrados que já testei. Surpreendeu-me ao entregar resultados satisfatórios na primeira tentativa, mesmo com uma solicitação simples. Os visuais, o áudio e a filmagem se combinam de uma forma que torna o resultado final refinado, em vez de experimental”, acrescentou Yakefu.
Embora os usuários elogiem o algoritmo, o Seedance 2.0 apresentou alguns problemas. A mídia chinesa noticiou que os desenvolvedores bloquearam temporariamente o recurso que gera uma voz humana a partir de uma foto enviada. Isso ocorreu depois que um blogueiro local destacou o problema da geração de voz baseada em uma foto sem o consentimento da pessoa retratada. Representantes da ByteDance ainda não se pronunciaram sobre o assunto.
Outro novo recurso é o modelo de IA Kling 3.0 da Kuaishou, projetado para geração de vídeo e concorrente do algoritmo da ByteDance. O anúncio afirma que o Kling 3.0 “apresenta melhorias significativas em consistência, resultados fotorrealistas, aumento na duração dos vídeos para 15 segundos e geração de áudio integrada em vários idiomas, dialetos e sotaques”.
Atualmente, o Kling 3.0 está disponível apenas para assinantes pagos, mas a Kuaishou promete disponibilizá-lo para um público mais amplo em breve. O sucesso da empresa com os modelos de IA do Kling impulsionou seu crescimento.As ações da Kuaishou subiram mais de 50% no último ano.
Outros lançamentos importantes merecem destaque. A Zhipu AI, empresa sediada em Hong Kong e que opera sob o nome de Knowledge Atlas Technology, apresentou o algoritmo GLM-5, um modelo de linguagem de código aberto com recursos aprimorados para programação e criação de agentes de IA. A empresa afirmou que a versão mais recente de seu modelo de IA se aproxima do Anthropic Claude Opus 4.5 em benchmarks de perfil e supera o Gemini 3 Pro do Google em alguns testes. Esse lançamento contribuiu para um aumento significativo no preço das ações da Zhipu AI.
As ações da MiniMax também dispararam no final da semana após o lançamento de uma versão atualizada de seu modelo de IA de código aberto, o M2.5, com ferramentas aprimoradas para agentes de IA. Esse algoritmo pode ser usado para automatizar diversas tarefas com eficiência.