A chinesa Tencent apresentou o gerador de vídeo HunyuanVideo, que os usuários consideraram o melhor dos existentes.

A gigante tecnológica chinesa Tencent anunciou o HunyuanVideo, um modelo avançado de inteligência artificial para geração de vídeo publicado como código aberto. Pela primeira vez, o código de saída e os pesos de um modelo de IA com tais capacidades estão disponíveis para todos.

Fonte da imagem: Tencent

HunyuanVideo, de acordo com a Tencent, é capaz de gerar vídeos no nível dos principais sistemas de código fechado do mundo – esses vídeos se distinguem pela alta qualidade de imagem, uma variedade de movimentos de objetos no quadro, a capacidade de sincronizar visual e áudio, como bem como estabilidade de geração. Este é o maior modelo para geração de vídeo – possui 13 bilhões de parâmetros. O pacote HunyuanVideo inclui uma estrutura com ferramentas de gerenciamento de dados; ferramentas para treinamento colaborativo de modelos que trabalham com imagens e vídeos; e infraestrutura para apoiar o treinamento e execução de modelos em larga escala.

A Tencent testou o modelo com o apoio da comunidade profissional, que concluiu que o HunyuanVideo é superior em qualidade aos projetos fechados Runway Gen-3 e Luma 1.6. Para alcançar esse resultado, o desenvolvedor recorreu a uma arquitetura de transmissão híbrida de fluxo duplo para fluxo único. Na fase inicial, os tokens de vídeo e texto são processados ​​​​de forma independente por vários blocos do modelo do transformador, para que dados de diferentes formatos sejam convertidos sem interferência. Durante o estágio de fluxo único, os tokens de vídeo e texto são passados ​​para os blocos transformadores subsequentes, permitindo a fusão eficiente de dados multimodais. Isso permite que as relações complexas entre informações visuais e semânticas sejam capturadas e o desempenho geral do modelo melhore.

Com o lançamento do HunyuanVideo, a Tencent deu um passo significativo em direção à democratização da tecnologia de criação de vídeo usando IA. Graças ao seu código-fonte aberto, o modelo é capaz de revolucionar o ecossistema de geração de vídeos.

avalanche

Postagens recentes

Meta retorna ao iGame: Superintelligence Lab revela a poderosa rede neural Muse Spark.

A Meta✴ lançou um novo modelo de IA chamado Muse Spark, após Mark Zuckerberg investir…

3 horas atrás

A Microsoft continua passando por mudanças em seu quadro de funcionários, com a renúncia do chefe de sua divisão de desenvolvedores.

A Microsoft perderá mais uma executiva experiente. Julia Liuson, chefe da divisão de desenvolvedores da…

4 horas atrás

Um aliado inesperado: as baterias nucleares irão acelerar o desenvolvimento de usinas de energia de fusão.

Construir um reator de fusão é uma coisa, mas gerar eletricidade a partir dele é…

4 horas atrás

Dez anos após seu lançamento, No Man’s Sky se tornou um análogo de Pokémon – trailer e detalhes da atualização Xeno Arena.

Os desenvolvedores do estúdio britânico Hello Games lançaram Xeno Arena (versão 6.3) – mais uma…

5 horas atrás

Os desenvolvedores de Forza Horizon 6 revelaram o mapa completo do Japão e seis minutos da explosiva introdução do jogo.

A editora Xbox Game Studios e os desenvolvedores do estúdio britânico Playground Games revelaram o…

7 horas atrás

Os desenvolvedores de Forza Horizon 6 revelaram o mapa completo do Japão e seis minutos da explosiva introdução do jogo.

A editora Xbox Game Studios e os desenvolvedores do estúdio britânico Playground Games revelaram o…

7 horas atrás