O Google apresentou um gerador de imagens avançado, o Imagen 2, que, segundo o desenvolvedor, é altamente realista e livre de artefatos típicos de sistemas de inteligência artificial. O sistema está disponível como parte do chatbot Bard e como um serviço ImageFX separado na plataforma de testes beta AI Test Kitchen.
O Google melhorou Bard de forma abrangente: o chatbot agora é baseado no grande modelo de linguagem Gemini Pro – foi lançado em dezembro, mas até agora só funcionava para uma pequena parte dos usuários. O Gemini Pro agora está disponível onde quer que a Bard opere – em todos os idiomas suportados, em todos os países e territórios.
Mas o que Bard ainda não tinha era um gerador de imagens. Anteriormente, a empresa era inferior neste segmento tanto ao Bing Image Creator quanto ao Midjourney. Mas com o lançamento do Imagen 2, as forças parecem ter se recuperado – essa rede neural agora funciona tanto como parte de um chatbot quanto como um serviço ImageFX separado. Porém, neste último caso, você precisará se cadastrar no programa AI Test Kitchen – junto com o MusicFX, cuja qualidade o Google também melhorou. ImageFX permite não apenas gerar imagens realistas com base em descrições de texto, mas também editá-las, inclusive alterando o estilo.
A empresa enfatizou que as imagens criadas pelo ImageFX são marcadas como criadas por IA por meio de metadados e marcas d’água digitais SynthID; se essas imagens aparecerem na pesquisa do Google, elas também receberão uma marca correspondente. Imagen 2 “oferece imagens da mais alta qualidade disponíveis atualmente, bem como melhorias em áreas problemáticas de sistemas de texto para imagem, como renderização de mãos e rostos humanos realistas, livrando imagens de artefatos visuais que distraem”, disse Eli Collins, vice-presidente da Google DeepMind (Eli Collins). A desenvolvedora também garantiu que tomou medidas de proteção que evitarão que a plataforma gere conteúdo impróprio.