A rede neural generativa MidJourney para criar imagens a partir de uma descrição de texto foi atualizada para a quinta versão

Os desenvolvedores apresentaram a quinta versão do sistema de inteligência artificial generativa MidJourney, capaz de criar imagens a partir de descrições de texto. A nova versão da rede AI generativa está atualmente disponível como parte do programa de teste alfa para quem assina o serviço MidJourney. Você pode se inscrever no canal oficial do desenvolvedor no Discord.

Fonte da imagem: MidJourney

De acordo com a designer gráfica Julie Wieland, que frequentemente twitta imagens criadas com MidJourney, a rede generativa MidJourney v5 aprendeu a criar imagens quase fotorrealistas.

«O MJ v5 parece que você finalmente está usando óculos depois de sofrer de deficiência visual por um longo tempo. De repente, tudo ao seu redor vê, como em 4K. É impressionante e surpreendente”, comentou Wieland.

Wieland, que acompanha o desenvolvimento da rede generativa MidJourney há muito tempo, compartilhou imagens mostrando o progresso em sua evolução. Sua primeira versão foi apresentada em março de 2022. A rede generativa chegou à terceira versão em agosto, e a quarta versão foi apresentada em novembro. Abaixo estão exemplos que mostram o progresso no desenvolvimento desta tecnologia. A cada nova geração, a rede neural aprendia a criar imagens mais complexas e detalhadas.

MidJourney v3 (esquerda), MidJourney v4 (centro) e MidJourney v5 (direita)

O MidJourney funciona com o mesmo princípio de outros sistemas generativos de IA, como Stable Diffusion e DALL-E. Eles criam imagens com base em uma determinada descrição de texto (promt) usando um modelo de IA treinado em milhões de imagens criadas por humanos.

Durante um dia de experimentos do MidJourney v5, Wieland concluiu que a rede neural havia feito um progresso significativo. Ela aprendeu a renderizar texturas de pele e características faciais “incrivelmente realistas”, criar iluminação mais realista e cinematográfica, transmitir melhor reflexos, destaques e sombras, escolher ângulos mais expressivos e tomadas gerais “e aprendeu a criar olhos quase perfeitamente”.

Além disso, MidJourney v5 aprendeu a desenhar mãos e dentes melhor. A descrição do MidJourney v5 indica que o sistema generativo de inteligência artificial recebeu uma gama estilística expandida, aumentou a capacidade de resposta às solicitações e a resolução das imagens geradas foi dobrada. Além disso, faixa dinâmica e detalhes aprimorados.

A rede neural generativa MidJourney para criar imagens a partir de uma descrição de texto foi atualizada para a quinta versão

Byavalanche

By avalanche

Veja Mais

O Google lançou a família de modelos de código aberto Gemma 4, que oferece suporte a 140 idiomas e é licenciada sob a licença Apache 2.0.

A Microsoft AI revelou três modelos de IA próprios para geração de texto, voz e imagens.

O Google atualizou seu assistente de IA para casas inteligentes: o Gemini in Home agora entende melhor comandos complexos.

Deixe um comentário Cancelar resposta