A versão alfa do Midjourney V6, um gerador de imagens de IA, foi lançada. Entre as inovações mais notáveis, os desenvolvedores destacam imagens mais realistas e detalhadas, bem como a capacidade do modelo de gerar texto legível dentro das imagens.
Midjourney V6 é na verdade “o terceiro modelo treinado do zero em nossos superaglomerados de IA” e levou nove meses para ser desenvolvido, explicou o CEO da empresa, David Holz. A conexão à rede neural atualizada não acontece para todos os usuários por padrão – em um bate-papo do Discord com o bot Midjourney, você precisa ir para o modo de configurações com o comando “/settings” e, em seguida, selecionar “V6” no menu suspenso. menu inferior na parte superior. Como alternativa, você pode adicionar a opção “-v 6” após cada descrição de imagem.
O Sr. Holtz chamou a atenção para as seguintes inovações: “adesão muito mais precisa às descrições e descrições mais longas; melhor consistência e conhecimento do modelo; mecanismos aprimorados de dicas e edição; algumas possibilidades de desenho de texto – está indicado entre aspas, os parâmetros “–style raw” e valores baixos “–stylize” podem ajudar; ferramentas de dimensionamento aprimoradas com modos “precisos” e “criativos”.
O mecanismo de criação de descrições de imagens no Midjourney foi completamente redesenhado: parâmetros como “fotorrealismo” ou “4K” não funcionam mais e os usuários terão que reaprender. Os desenvolvedores aconselham ser mais abertos sobre o que os usuários desejam. Portanto, caso seja necessária uma imagem fotorrealista, recomenda-se utilizar o parâmetro “–style raw”. Você também deve selecionar o equilíbrio desejado do parâmetro “–stylize”, cujo valor padrão é “100”. Quanto menor o valor, mais literalmente o modelo percebe o comando e, à medida que aumenta, cresce o aspecto estético da imagem.
O chefe da Midjourney enfatizou que o V6 foi lançado como parte do teste alfa – seu trabalho pode mudar drasticamente com o tempo e muitas vezes sem aviso prévio ao público. Com o lançamento completo do modelo, os desenvolvedores esperam, “todos vocês sentirão o desenvolvimento de algo mais significativo, que está profundamente entrelaçado com o poder de nossa imaginação coletiva”. Mas, por enquanto, o Midjourney V6 carece de alguns dos recursos encontrados na V5.2, incluindo panorâmica para a esquerda e para a direita e redução de zoom, mas atualizações futuras irão adicioná-los.