Em fevereiro, a OpenAI demonstrou pela primeira vez a rede neural Sora, capaz de gerar vídeos realistas a partir de descrições de texto. Por enquanto, esta ferramenta está disponível apenas para artistas, designers e cineastas. Hoje, a CTO da OpenAI, Mira Murati, anunciou que Sora estará disponível ao público em geral “ainda este ano”. Murati prometeu que a capacidade de Sora de criar vídeos adicionará geração de som, o que tornará os vídeos ainda mais realistas.
A OpenAI está atualmente trabalhando na capacidade de editar conteúdo em vídeos Sora, já que as ferramentas de inteligência artificial nem sempre criam imagens precisas. “Estamos tentando descobrir como usar essa tecnologia como uma ferramenta para as pessoas editarem conteúdo de mídia”, disse Murati.
Murati evitou responder perguntas sobre quais dados a OpenAI usou para treinar Sora. “Não vou entrar em detalhes sobre os dados que foram usados, mas eram dados publicamente disponíveis ou licenciados”, disse ela. Murati não confirmou nem negou o uso de vídeos do YouTube, Facebook✴ e Instagram✴. Ela observou que Sora usa conteúdo do site de hospedagem de fotos Shutterstock, com o qual a OpenAI tem acordo de parceria.
Murati disse que hoje o Sora difere de outros modelos de IA em seus maiores requisitos de recursos computacionais. A OpenAI está trabalhando para tornar esta ferramenta “disponível pelo mesmo preço” do modelo de texto para imagem do DALL-E.
As preocupações do público sobre as ferramentas generativas de IA e a sua capacidade de criar desinformação estão a aumentar. Segundo Murati, Sora não poderá criar imagens de figuras públicas, assim como DALL-E. Os vídeos do Sora também incluirão marcas d’água, mas não são uma proteção perfeita e podem ser removidas do vídeo usando IA ou tecnologias tradicionais.