A empresa chinesa DeepSeek, que ganhou imensa popularidade graças ao seu chatbot AI, anunciou a família Janus Pro de modelos multimodais de inteligência artificial. A empresa afirma que esses algoritmos, disponíveis sob licença aberta do MIT, são capazes de gerar e analisar imagens melhor que OpenAI DALL-E 3, PixArt-alpha e Stable Diffusion XL.
Fonte da imagem: hdhAI
O Janus Pro está disponível em versões com 1 a 7 bilhões de parâmetros – quanto mais, melhor será o desempenho. O modelo principal Janus Pro 7B, como relata o TechCrunch, demonstrou com sucesso suas capacidades nos benchmarks GenEval e DPG-Bench. “O Janus Pro é superior aos modelos de uso geral anteriores e é comparável, ou mesmo superior, às soluções altamente especializadas de outras empresas. Simplicidade, flexibilidade e eficiência fazem do nosso modelo de IA um candidato para a próxima geração de sistemas multimodais”, afirmou a empresa em comunicado.
A arquitetura Janus Pro permite não apenas criar imagens, mas também analisá-las. Porém, a versão atual se limita a gerar imagens com resolução de 384 × 384 pixels, valor inferior aos padrões dos modelos modernos. No entanto, para modelos compactos de IA tais resultados são considerados impressionantes, especialmente em comparação com os concorrentes.
Fonte da imagem: DeepSeek
Vale dizer que o sucesso do DeepSeek atraiu grande atenção depois que seu chatbot liderou os principais aplicativos da App Store. Mas a startup, financiada pela High-Flyer Capital Management e que utiliza métodos de formação energeticamente eficientes, faz com que analistas de Wall Street e especialistas em TI duvidem que os Estados Unidos consigam manter a sua liderança na corrida pelas soluções de inteligência artificial. Alguns também estão se perguntando se a atual corrida por chips de IA continuará, já que o DeepSeek adotou abordagens muito diferentes.
Como observam os especialistas, a natureza revolucionária do Janus Pro reside na sua versatilidade. Combina análise e geração, o que é raro em modelos deste tamanho. Embora a resolução da imagem ainda não esteja no nível do DALL-E 3, a licença aberta e a adaptabilidade podem acelerar a adoção do Janus Pro em projetos comerciais.
Em meados do ano, tornou-se público que a Intel e a SoftBank estavam tentando desenvolver…
O jogo de tiro hardcore com temática de evacuação, Escape from Tarkov, está atualmente disponível…
A fabricante taiwanesa de chips TSMC utiliza equipamentos e tecnologia de origem americana e, portanto,…
Enquanto alguns fabricantes de robôs humanoides, seguindo o exemplo da Tesla, prometem inundar o mercado…
O canal do YouTube Tech Overwrite perguntou aos fabricantes de placas gráficas e fontes de…
A Xiaomi apresentou seu smartwatch topo de linha, o Xiaomi Watch 5, na China, com…