A aclamada startup DeepSeek lançou o Janus Pro, um poderoso gerador de imagens de IA que rivaliza com o OpenAI DALL-E 3

A empresa chinesa DeepSeek, que ganhou imensa popularidade graças ao seu chatbot AI, anunciou a família Janus Pro de modelos multimodais de inteligência artificial. A empresa afirma que esses algoritmos, disponíveis sob licença aberta do MIT, são capazes de gerar e analisar imagens melhor que OpenAI DALL-E 3, PixArt-alpha e Stable Diffusion XL.

Fonte da imagem: hdhAI

O Janus Pro está disponível em versões com 1 a 7 bilhões de parâmetros – quanto mais, melhor será o desempenho. O modelo principal Janus Pro 7B, como relata o TechCrunch, demonstrou com sucesso suas capacidades nos benchmarks GenEval e DPG-Bench. “O Janus Pro é superior aos modelos de uso geral anteriores e é comparável, ou mesmo superior, às soluções altamente especializadas de outras empresas. Simplicidade, flexibilidade e eficiência fazem do nosso modelo de IA um candidato para a próxima geração de sistemas multimodais”, afirmou a empresa em comunicado.

A arquitetura Janus Pro permite não apenas criar imagens, mas também analisá-las. Porém, a versão atual se limita a gerar imagens com resolução de 384 × 384 pixels, valor inferior aos padrões dos modelos modernos. No entanto, para modelos compactos de IA tais resultados são considerados impressionantes, especialmente em comparação com os concorrentes.

Fonte da imagem: DeepSeek

Vale dizer que o sucesso do DeepSeek atraiu grande atenção depois que seu chatbot liderou os principais aplicativos da App Store. Mas a startup, financiada pela High-Flyer Capital Management e que utiliza métodos de formação energeticamente eficientes, faz com que analistas de Wall Street e especialistas em TI duvidem que os Estados Unidos consigam manter a sua liderança na corrida pelas soluções de inteligência artificial. Alguns também estão se perguntando se a atual corrida por chips de IA continuará, já que o DeepSeek adotou abordagens muito diferentes.

Como observam os especialistas, a natureza revolucionária do Janus Pro reside na sua versatilidade. Combina análise e geração, o que é raro em modelos deste tamanho. Embora a resolução da imagem ainda não esteja no nível do DALL-E 3, a licença aberta e a adaptabilidade podem acelerar a adoção do Janus Pro em projetos comerciais.

avalanche

Postagens recentes

Filmado em Hollywood? Por que Stanley Kubrick não conseguiu simular fisicamente o Moonwalk / Offsyanka

⇡#Parte 1. Elegância cinematográfica versus monstruosidade biomecânica Qualquer pessoa que estude imagens das missões lunares…

4 horas atrás

Um vazamento mostra os óculos Samsung Galaxy de todos os ângulos.

A Samsung deverá apresentar seus primeiros óculos inteligentes antes do final deste ano. Embora a…

5 horas atrás

A Microsoft estava desenvolvendo um sistema operacional de IA distinto do Windows, com profunda integração do Copilot e de agentes.

De acordo com o Windows Central, a Microsoft explorou a possibilidade de criar um sistema…

6 horas atrás

O novo crossover R2 dá novo fôlego à Rivian: vendas superam expectativas, previsão revisada para cima.

A Rivian Automotive Inc. elevou sua previsão de vendas de veículos elétricos para este ano.…

6 horas atrás