A OpenAI pretende transformar o ChatGPT em um superaplicativo, e outra grande atualização está atualmente em desenvolvimento. Um componente chave da atualização será o assistente de programação e as ferramentas de agente de IA do OpenAI Codex. Além disso, o aplicativo foi atualizado com um modelo de áudio bidirecional, o GPT Bidi 1, projetado para aprimorar os recursos de voz do ChatGPT.

Fonte da imagem: BoliviaInteligente / unsplash.com
O nome Bidi supostamente significa “design bidirecional”, permitindo que a IA ouça o usuário e fale simultaneamente. Referências ao Bidi 1 foram descobertas na semana passada, com o código descrevendo o modelo como um “salto significativo em inteligência” e uma “interface de voz de próxima geração”. O Bidi 1 estará disponível na lista de seleção de modelos, juntamente com as opções padrão e avançadas; quando selecionado, o ícone de “balão” fica amarelo.

Fonte da imagem: x.com/testingcatalog
O novo modelo já começou a ser implementado em alguns aplicativos de usuários e seu lançamento oficial é esperado para esta semana, de acordo com os autores do TestingCatalog. Ele suporta confirmações simples e naturais, como um simples “ok” quando o usuário pausa ou diminui o ritmo da conversa, sem interrompê-la. Também pode alternar entre tarefas instantaneamente: você pode pedir ao modelo para contar até dez, pausar para alterar a contagem e ele se adaptará.
A mudança mais importante é que o modelo mantém o fio da conversa inteira, sem perder o contexto anterior, o que era uma fragilidade do ChatGPT. Ele não tenta preencher longas pausas com suas próprias respostas. O Bidi 1 pode ser visto como uma oportunidade para a OpenAI reduzir a lacuna entre os modelos baseados em texto de longo alcance e os recursos de voz legados. A empresa aposta que a voz, e não o texto, se tornará a principal interface para a maioria dos usuários. Ainda não houve nenhum anúncio oficial do Bidi 1 e o desenvolvedor ainda não forneceu informações detalhadas sobre o novo GPT 5.6.