Especialistas entrevistados pelo Financial Times concordam que, embora os desenvolvedores americanos de IA sejam líderes em assistentes de programação, os desenvolvedores chineses já lideram o campo da geração de vídeos baseados em texto. Suas ferramentas são superiores em qualidade e facilidade de uso.

Fonte da imagem: ByteDance

O treinamento de modelos de linguagem tão complexos exige uma quantidade maior de filmagens, e é nesse ponto que as plataformas chinesas, com sua vasta base de usuários, levam uma clara vantagem. Alguns especialistas também acreditam que os desenvolvedores chineses frequentemente ignoram os direitos autorais ao treinar modelos especializados. Por outro lado, essas limitações acabam resultando em vídeos menos realistas produzidos por modelos americanos.

Ben Chiang, fundador da startup Director AI, que produz curtas de animação e séries de TV utilizando geradores de IA, destaca as melhorias nos geradores de vídeo chineses. Especificamente, eles compreendem melhor as consultas de texto, sincronizam o áudio e estabilizam as vozes dos personagens. O produtor independente George Won, de Tbilisi, observa que os geradores de vídeo chineses permitem mudanças dinâmicas nos ângulos de câmera sem perder detalhes de iluminação e nitidez facial, enquanto muitos modelos, nessas situações, produzem artefatos.

A plataforma independente Arena valoriza bastante os modelos de IA da Kling, Seedance 2.0 e HappyHorse 1.0. O Veo 3 americano do Google também está próximo deles graças ao acesso ao seu serviço irmão, o YouTube, mas, devido a restrições de direitos autorais, não é tão bom quanto poderia ser. O sucesso dos geradores de vídeo com IA chineses levou a Kuaishou a considerar transformar o Kling em um negócio independente e abri-lo ao público. O uso permissivo de conteúdo protegido por direitos autorais pela ByteDance já gerou reclamações de criadores de personagens da Marvel eA série animada South Park. A empresa chinesa foi obrigada a se comprometer com o reforço da segurança nessa área.

Ao mesmo tempo, os geradores de vídeo chineses são mais fáceis de usar, pois não encontram inúmeras limitações na etapa de consulta de texto e não apresentam erros. No entanto, a alta demanda pelos serviços do Seedance 2.0 em fevereiro deste ano levou à necessidade de limitar o acesso ao modelo de IA e aumentar o tempo de espera para alguns usuários. Os clientes americanos da ByteDance precisam acessar o Seedance sob condições especiais. No segmento corporativo, às vezes eles têm que desembolsar até US$ 2 milhões antecipadamente. Contudo, ferramentas para superar essas barreiras já estão disponíveis no mercado. A manutenção da infraestrutura de geração de vídeo exige custos significativos, pois consome mais recursos do que modelos que funcionam apenas com áudio ou texto. Em resposta a isso, a OpenAI chegou a abandonar o desenvolvimento de seu modelo Sora em março. A IA já está sendo usada em larga escala na produção de comerciais, e representantes do setor a consideram uma ferramenta muito conveniente e lucrativa — especialmente porque a qualidade do conteúdo atingiu um nível difícil de distinguir de filmagens feitas em locações reais. Uma agência de publicidade admitiu ao Financial Times que criou 100 mil vídeos diferentes a pedido de um cliente, algo que teria sido extremamente caro de produzir usando métodos tradicionais.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *