A empresa chinesa DeepSeek, que ganhou imensa popularidade graças ao seu chatbot AI, anunciou a família Janus Pro de modelos multimodais de inteligência artificial. A empresa afirma que esses algoritmos, disponíveis sob licença aberta do MIT, são capazes de gerar e analisar imagens melhor que OpenAI DALL-E 3, PixArt-alpha e Stable Diffusion XL.

Fonte da imagem: hdhAI

O Janus Pro está disponível em versões com 1 a 7 bilhões de parâmetros – quanto mais, melhor será o desempenho. O modelo principal Janus Pro 7B, como relata o TechCrunch, demonstrou com sucesso suas capacidades nos benchmarks GenEval e DPG-Bench. “O Janus Pro é superior aos modelos de uso geral anteriores e é comparável, ou mesmo superior, às soluções altamente especializadas de outras empresas. Simplicidade, flexibilidade e eficiência fazem do nosso modelo de IA um candidato para a próxima geração de sistemas multimodais”, afirmou a empresa em comunicado.

A arquitetura Janus Pro permite não apenas criar imagens, mas também analisá-las. Porém, a versão atual se limita a gerar imagens com resolução de 384 × 384 pixels, valor inferior aos padrões dos modelos modernos. No entanto, para modelos compactos de IA tais resultados são considerados impressionantes, especialmente em comparação com os concorrentes.

Fonte da imagem: DeepSeek

Vale dizer que o sucesso do DeepSeek atraiu grande atenção depois que seu chatbot liderou os principais aplicativos da App Store. Mas a startup, financiada pela High-Flyer Capital Management e que utiliza métodos de formação energeticamente eficientes, faz com que analistas de Wall Street e especialistas em TI duvidem que os Estados Unidos consigam manter a sua liderança na corrida pelas soluções de inteligência artificial. Alguns também estão se perguntando se a atual corrida por chips de IA continuará, já que o DeepSeek adotou abordagens muito diferentes.

Como observam os especialistas, a natureza revolucionária do Janus Pro reside na sua versatilidade. Combina análise e geração, o que é raro em modelos deste tamanho. Embora a resolução da imagem ainda não esteja no nível do DALL-E 3, a licença aberta e a adaptabilidade podem acelerar a adoção do Janus Pro em projetos comerciais.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *