Enquanto o mercado de IA dos EUA estava ocupado na semana passada estudando o impacto de ferramentas antrópicas e altruístas na programação e nos serviços financeiros, gigantes da tecnologia chinesas lançaram modelos de IA que demonstraram ganhos de desempenho em robótica e geração de vídeo. Alibaba, ByteDance (proprietária do TikTok) e a plataforma de vídeos curtos Kuaishou revelaram novos algoritmos, confirmando que os desenvolvedores chineses estão acompanhando o ritmo de seus colegas americanos.

Fonte da imagem: Gemini

O anúncio dos novos algoritmos das gigantes chinesas de tecnologia surge em meio a uma declaração recente de Demis Hassabis, chefe da divisão de IA DeepMind do Google, de que os modelos de IA chineses estão apenas alguns meses atrás de seus concorrentes ocidentais. No entanto, as ferramentas apresentadas na semana passada podem muito bem ser consideradas concorrentes diretas de modelos de IA para geração de vídeo, como o Sora da OpenAI, bem como de modelos de robótica da Nvidia e do Google.

A divisão de pesquisa da Alibaba, DAMO, anunciou o RynnBrain, um modelo de IA projetado para ajudar robôs a entender o mundo físico ao seu redor e identificar objetos. Em um vídeo de demonstração, a Alibaba mostrou um robô com garras no lugar das mãos colhendo laranjas e colocando-as em uma cesta. O robô também foi mostrado pegando leite de uma geladeira.

Os modelos de IA exigem treinamento extensivo para atingir seu objetivo de identificar e interagir com objetos do cotidiano. Isso significa que um processo tão simples para humanos quanto colher frutas é muito mais complexo para a robótica. Com o lançamento do RynnBrain, a Alibaba começará a competir com empresas como a Nvidia e o Google, que estão desenvolvendo seus próprios modelos de IA para robótica. Uma das principais inovações do modelo de IA é a sua percepção intrínseca de tempo e espaço. Em vez de simplesmente responder a estímulos imediatos, o robô consegue lembrar quando e onde os eventos ocorreram, acompanhar o progresso de uma tarefa e continuar a agir em várias etapas. Isso o torna mais confiável e consistente.”Em condições complexas do mundo real”, afirma Adina Yakefu, pesquisadora da Hugging Face. Ela acrescentou que o “objetivo maior” do Alibaba é “criar uma camada básica de inteligência para sistemas incorporados”.

Na semana passada, a ByteDance apresentou o Seedance 2.0, um modelo de IA para geração de vídeos capaz de criar vídeos realistas a partir de descrições textuais simples. O algoritmo também funciona com outros vídeos e imagens. Os vídeos de demonstração criados com o Seedance 2.0 parecem bastante realistas.

Fonte da imagem: Sony

Adina Yakefu confirmou que o modelo de IA Seedance 2.0 apresentou melhorias significativas em relação às versões anteriores em termos de “controlabilidade, velocidade e eficiência”. “O Seedance 2.0 é um dos modelos de geração de vídeo mais equilibrados que já testei. Surpreendeu-me ao entregar resultados satisfatórios na primeira tentativa, mesmo com uma solicitação simples. Os visuais, o áudio e a filmagem se combinam de uma forma que torna o resultado final refinado, em vez de experimental”, acrescentou Yakefu.

Embora os usuários elogiem o algoritmo, o Seedance 2.0 apresentou alguns problemas. A mídia chinesa noticiou que os desenvolvedores bloquearam temporariamente o recurso que gera uma voz humana a partir de uma foto enviada. Isso ocorreu depois que um blogueiro local destacou o problema da geração de voz baseada em uma foto sem o consentimento da pessoa retratada. Representantes da ByteDance ainda não se pronunciaram sobre o assunto.

Outro novo recurso é o modelo de IA Kling 3.0 da Kuaishou, projetado para geração de vídeo e concorrente do algoritmo da ByteDance. O anúncio afirma que o Kling 3.0 “apresenta melhorias significativas em consistência, resultados fotorrealistas, aumento na duração dos vídeos para 15 segundos e geração de áudio integrada em vários idiomas, dialetos e sotaques”.

Atualmente, o Kling 3.0 está disponível apenas para assinantes pagos, mas a Kuaishou promete disponibilizá-lo para um público mais amplo em breve. O sucesso da empresa com os modelos de IA do Kling impulsionou seu crescimento.As ações da Kuaishou subiram mais de 50% no último ano.

Outros lançamentos importantes merecem destaque. A Zhipu AI, empresa sediada em Hong Kong e que opera sob o nome de Knowledge Atlas Technology, apresentou o algoritmo GLM-5, um modelo de linguagem de código aberto com recursos aprimorados para programação e criação de agentes de IA. A empresa afirmou que a versão mais recente de seu modelo de IA se aproxima do Anthropic Claude Opus 4.5 em benchmarks de perfil e supera o Gemini 3 Pro do Google em alguns testes. Esse lançamento contribuiu para um aumento significativo no preço das ações da Zhipu AI.

As ações da MiniMax também dispararam no final da semana após o lançamento de uma versão atualizada de seu modelo de IA de código aberto, o M2.5, com ferramentas aprimoradas para agentes de IA. Esse algoritmo pode ser usado para automatizar diversas tarefas com eficiência.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Uma fonte interna revelou a data de lançamento de Resident Evil 10 e confirmou o conteúdo adicional (DLC) para Resident Evil Requiem.

Quase cinco anos se passarão entre o lançamento de Resident Evil Village e o aguardado…

34 minutos atrás

Um novo estudo descobriu que Marte era úmido e quente bilhões de anos atrás, não gelado.

Estudar os processos que ocorreram em Marte é importante para que os cientistas na Terra…

1 hora atrás

A Microsoft corrigiu as falhas de inicialização do Windows 11 que surgiram com uma atualização recente.

A Microsoft anunciou uma correção para um bug do Windows 11 que impedia alguns computadores…

2 horas atrás

A Microsoft corrigiu as falhas de inicialização do Windows 11 que surgiram com uma atualização recente.

A Microsoft anunciou uma correção para um bug do Windows 11 que impedia alguns computadores…

2 horas atrás

A Estação Espacial Internacional (ISS) está novamente com uma equipe de cosmonautas e astronautas após a evacuação de emergência em janeiro.

No último sábado, 14 de fevereiro, a espaçonave tripulada Crew Dragon acoplou-se à Estação Espacial…

2 horas atrás

A ASML está se preparando para a adoção em massa da tecnologia EUV de alta NA no próximo ano para chips de 1,4 nm e mais finos.

A necessidade de maior miniaturização dos componentes semicondutores está forçando os fabricantes a migrarem para…

2 horas atrás