Os desenvolvedores apresentaram a quinta versão do sistema de inteligência artificial generativa MidJourney, capaz de criar imagens a partir de descrições de texto. A nova versão da rede AI generativa está atualmente disponível como parte do programa de teste alfa para quem assina o serviço MidJourney. Você pode se inscrever no canal oficial do desenvolvedor no Discord.
De acordo com a designer gráfica Julie Wieland, que frequentemente twitta imagens criadas com MidJourney, a rede generativa MidJourney v5 aprendeu a criar imagens quase fotorrealistas.
«O MJ v5 parece que você finalmente está usando óculos depois de sofrer de deficiência visual por um longo tempo. De repente, tudo ao seu redor vê, como em 4K. É impressionante e surpreendente”, comentou Wieland.
Wieland, que acompanha o desenvolvimento da rede generativa MidJourney há muito tempo, compartilhou imagens mostrando o progresso em sua evolução. Sua primeira versão foi apresentada em março de 2022. A rede generativa chegou à terceira versão em agosto, e a quarta versão foi apresentada em novembro. Abaixo estão exemplos que mostram o progresso no desenvolvimento desta tecnologia. A cada nova geração, a rede neural aprendia a criar imagens mais complexas e detalhadas.
O MidJourney funciona com o mesmo princípio de outros sistemas generativos de IA, como Stable Diffusion e DALL-E. Eles criam imagens com base em uma determinada descrição de texto (promt) usando um modelo de IA treinado em milhões de imagens criadas por humanos.
Durante um dia de experimentos do MidJourney v5, Wieland concluiu que a rede neural havia feito um progresso significativo. Ela aprendeu a renderizar texturas de pele e características faciais “incrivelmente realistas”, criar iluminação mais realista e cinematográfica, transmitir melhor reflexos, destaques e sombras, escolher ângulos mais expressivos e tomadas gerais “e aprendeu a criar olhos quase perfeitamente”.
Além disso, MidJourney v5 aprendeu a desenhar mãos e dentes melhor. A descrição do MidJourney v5 indica que o sistema generativo de inteligência artificial recebeu uma gama estilística expandida, aumentou a capacidade de resposta às solicitações e a resolução das imagens geradas foi dobrada. Além disso, faixa dinâmica e detalhes aprimorados.