OpenAI introduziu o modelo GPT-4o AI – é muito mais inteligente que as versões mais antigas e estará disponível gratuitamente

A OpenAI revelou o GPT-4o, um poderoso modelo multimodal generativo de inteligência artificial (IA) que será implementado em suas soluções para desenvolvedores e consumidores nas próximas semanas. O “o” no nome do GPT-4o significa omni (abrangente), indicando que o GPT-4o é multimodal.

Fonte da imagem: OpenAI

Mira Murati, CTO da OpenAI, disse durante apresentação do produto no escritório da OpenAI em São Francisco (EUA) que o GPT-4o possui inteligência de “nível GPT-4”, mas maiores capacidades no trabalho com texto e imagens, e também com áudio. “O GPT-4o entende voz, texto e imagens visuais”, disse Murati. “E isso é extremamente importante quando pensamos sobre o futuro das interações entre nós e as máquinas.”

Seu antecessor, GPT-4 Turbo, foi treinado em uma combinação de imagens e texto. Ele pode analisar imagens e texto para realizar tarefas como extrair texto de imagens e até descrever o conteúdo dessas imagens. Por sua vez, o GPT-4o adicionou fala a esses recursos.

É relatado que o GPT-4o melhorará significativamente o desempenho do chatbot AI ChatGPT. Este último há muito suporta um modo de voz, no qual as respostas do chatbot são transcritas usando um modelo de conversão de texto em fala, mas o GPT-4o fortalecerá esse recurso, permitindo que os usuários interajam com o chatbot mais como um assistente. Por exemplo, você pode fazer uma pergunta e interrompê-lo quando ele responder. Segundo a OpenAI, o modelo GPT-4o fornece resposta em “tempo real” e pode até capturar emoções na voz do usuário, gerando uma voz em resposta “em diferentes estilos emocionais” de acordo com a situação atual.

O GPT-4o também melhorará os recursos visuais do ChatGPT. Com base em uma foto sugerida ou na tela do desktop, o ChatGPT agora poderá responder rapidamente a perguntas relacionadas, desde “O que está acontecendo neste código” até “Que marca de camisa essa pessoa está vestindo?”

No futuro, as capacidades do modelo serão ampliadas. Se o GPT-4o agora permite, por exemplo, traduzir um menu fotografado para outro idioma, então no futuro, com a sua ajuda, o ChatGPT poderá “assistir” a um jogo desportivo ao vivo e explicar-lhe as regras, diz Murati.

A partir de hoje, o GPT-4o está disponível no nível gratuito do ChatGPT, bem como para assinantes dos planos ChatGPT Plus e Team premium da OpenAI com limites de mensagens “5x”. Se o limite for excedido, o ChatGPT mudará automaticamente para GPT-3.5.

A OpenAI disse que o GPT-4o oferece suporte a mais idiomas, com desempenho aprimorado em 50 idiomas diferentes. Na API OpenAI, o GPT-4o é duas vezes mais rápido que o GPT-4 (especificamente o GPT-4 Turbo), metade do preço e tem limites de velocidade mais altos.

Atualmente, o suporte de voz não está incluído na API GPT-4o para todos os clientes. A OpenAI explicou que, devido ao risco de uso indevido, planeja lançar suporte para os novos recursos de áudio GPT-4o pela primeira vez nas próximas semanas para um “pequeno grupo de parceiros confiáveis”.

avalanche

Postagens recentes

A ByteDance está em negociações para adquirir as aceleradoras de IA chinesas Iluvatar CoreX e Baidu.

A ByteDance, empresa controladora do TikTok, está em negociações com a Iluvatar CoreX, sediada em…

21 minutos atrás

Dois anos após o lançamento, a Capcom removerá as microtransações de Dragon’s Dogma 2 e reduzirá o preço do jogo.

O anúncio da expansão Dark Arisen e de duas grandes atualizações não foi a última…

21 minutos atrás

A MSI definiu o preço do console portátil Claw 8 EX AI+, equipado com o chip Arc G3 Extreme, em US$ 1.799.

A MSI anunciou o preço de seu novo console portátil para jogos, o MSI Claw…

35 minutos atrás

A Electra projetou um futuro avião comercial com uma fuselagem em formato de “bolha dupla” e três motores elétricos na cauda.

A Electra apresentou um conceito de aeronave híbrida com aerodinâmica avançada, capaz de transportar mais…

51 minutos atrás

A montadora chinesa Seres apresentou um robô humanoide, Xiaosai, capaz de manter uma conversa.

Grandes montadoras estão buscando um espaço no mercado de robôs humanoides, seguindo o exemplo da…

1 hora atrás