O presidente da OpenAI publicou uma imagem criada pelo GPT-4o – é muito impressionante

Esta semana, a OpenAI revelou seu modelo de inteligência artificial de próxima geração, GPT-4o. O “o” em seu nome significa Omni, o que implica que ele oferece suporte nativo a vários formatos de entrada – anteriormente, multimodalidade significava converter todos os formatos não textuais em texto. O presidente e cofundador da OpenAI, Greg Brockman, divulgou a imagem criada pelo GPT-4o pela primeira vez.

A mesma imagem gerada pelo GPT-4o. Fonte da imagem: twitter.com/gdb

Suportar texto, imagens e áudio como entrada significa que o modelo também é capaz de gerá-los. A imagem acima não é uma fotografia, mas sim uma criação do GPT-4o. Mostra um homem vestindo uma camiseta com o logotipo da OpenAI escrito em um quadro branco. Na parte superior há uma inscrição parcialmente apagada “Transferência entre modalidades”. O texto segue: “Suponha que modelemos P diretamente (texto, pixels, som) usando um único transformador autorregressivo. Quais são os prós e contras?

Se você olhar de perto, poderá ver alguns sinais de que a imagem foi criada pela IA. A prancha está pendurada em um ângulo não natural, outra está inexplicavelmente localizada embaixo dela, a mão do homem tem um formato estranho e a iluminação é irregular. Ao mesmo tempo, a capacidade da IA ​​de gerar longos fragmentos de texto coerente parece incrível – mesmo o DALL-E 3 dificilmente consegue lidar com isso. O gerador de imagens GPT-4o ainda não está disponível para o público em geral: usuários do ChatGPT com conexão. o modelo de próxima geração só pode gerar imagens com DALL -E 3. Mas o presidente da OpenAI, Greg Brockman, garante que a empresa está fazendo esforços significativos para abrir acesso total ao modelo de nova geração.

avalanche

Postagens recentes

A Apple não poderá trazer suporte para monitoramento de pressão arterial para o Watch este ano

No mês passado soube-se que o novo smartwatch Apple Watch Series 10, que deve ser…

42 minutos atrás

A integração avançada de Siri e Apple Intelligence não será implementada até o próximo ano

Como já foi observado mais de uma vez desde a apresentação da Apple na WWDC…

3 horas atrás

Zotac publicou acidentalmente dados pessoais de clientes

A Zotac vazou acidentalmente dados pessoais de muitos de seus clientes online devido a um…

4 horas atrás

Os desenvolvedores de IA começaram a mudar para modelos compactos de IA – eles são mais baratos e mais econômicos

Gigantes da tecnologia e startups estão migrando para modelos de IA menores e mais eficientes,…

4 horas atrás

Os primeiros proprietários do Tesla Cybertruck recebem uma substituição gratuita do motor de tração

As picapes elétricas Tesla Cybertruck começaram a sair da linha de montagem da fábrica da…

4 horas atrás

A NASCAR revelou um protótipo de carro de corrida elétrico com 1.341 cv. e bateria com suporte de vida

A NASCAR exibiu um protótipo de carro de corrida elétrico na NASCAR Chicago Street Race,…

4 horas atrás