O presidente da OpenAI publicou uma imagem criada pelo GPT-4o – é muito impressionante

Esta semana, a OpenAI revelou seu modelo de inteligência artificial de próxima geração, GPT-4o. O “o” em seu nome significa Omni, o que implica que ele oferece suporte nativo a vários formatos de entrada – anteriormente, multimodalidade significava converter todos os formatos não textuais em texto. O presidente e cofundador da OpenAI, Greg Brockman, divulgou a imagem criada pelo GPT-4o pela primeira vez.

A mesma imagem gerada pelo GPT-4o. Fonte da imagem: twitter.com/gdb

Suportar texto, imagens e áudio como entrada significa que o modelo também é capaz de gerá-los. A imagem acima não é uma fotografia, mas sim uma criação do GPT-4o. Mostra um homem vestindo uma camiseta com o logotipo da OpenAI escrito em um quadro branco. Na parte superior há uma inscrição parcialmente apagada “Transferência entre modalidades”. O texto segue: “Suponha que modelemos P diretamente (texto, pixels, som) usando um único transformador autorregressivo. Quais são os prós e contras?

Se você olhar de perto, poderá ver alguns sinais de que a imagem foi criada pela IA. A prancha está pendurada em um ângulo não natural, outra está inexplicavelmente localizada embaixo dela, a mão do homem tem um formato estranho e a iluminação é irregular. Ao mesmo tempo, a capacidade da IA ​​de gerar longos fragmentos de texto coerente parece incrível – mesmo o DALL-E 3 dificilmente consegue lidar com isso. O gerador de imagens GPT-4o ainda não está disponível para o público em geral: usuários do ChatGPT com conexão. o modelo de próxima geração só pode gerar imagens com DALL -E 3. Mas o presidente da OpenAI, Greg Brockman, garante que a empresa está fazendo esforços significativos para abrir acesso total ao modelo de nova geração.

avalanche

Postagens recentes

Enquanto o mundo corre atrás dos chips de IA, a SMIC da China está lucrando com tecnologias de processo já consolidadas.

A SMIC, maior fabricante de chips sob encomenda da China, relatou um aumento no número…

39 minutos atrás

Os óculos de realidade aumentada para jogos Asus ROG Xreal R1 estão disponíveis para pré-encomenda por US$ 849.

A divisão de jogos da Asus abriu a pré-venda do headset de realidade aumentada ROG…

40 minutos atrás

Cientistas alemães alcançaram uma eficiência recorde na conversão da luz solar em hidrogênio.

Cientistas do Instituto Fraunhofer de Sistemas de Energia Solar, na Alemanha, anunciaram um novo recorde…

1 hora atrás

A Asus lançou sua primeira memória RAM — e o preço é de US$ 880.

A Asus apresentou seu primeiro kit de memória RAM, o ROG DDR5 RGB Edition 20.…

1 hora atrás