OpenAI abriu a IA de fala do ChatGPT para desenvolvedores terceirizados – estamos aguardando uma onda de aplicativos falantes

OpenAI introduziu novos recursos para simplificar o processo de criação de aplicativos baseados em inteligência artificial. Os desenvolvedores agora podem usar uma ferramenta online para criar soluções de IA baseadas em voz usando um único conjunto de instruções.

Fonte da imagem: OpenAI

A OpenAI obtém a maior parte de sua receita de empresas que usam as redes neurais da empresa para criar seus próprios aplicativos de IA. Expandir a capacidade de criar tais produtos faz sentido à medida que a batalha da IA ​​se intensifica com empresas como o Google introduzindo algoritmos em seus produtos que podem processar diferentes tipos de informações, incluindo texto, imagens e vídeo.

O processo de criação de assistentes de voz exige que os desenvolvedores passem por pelo menos três etapas: conversão de áudio em texto, processamento da solicitação e geração de uma resposta em texto e conversão da resposta recebida em áudio. Como parte da implementação de novos recursos para a criação de aplicativos de IA de voz, a OpenAI introduziu uma ferramenta para ajustar grandes modelos de linguagem após concluir a fase de treinamento. Essa abordagem melhorará a qualidade das respostas que os algoritmos criados pelos desenvolvedores geram em resposta a consultas em formato de texto e usando imagens. A fase de ajuste fino pode ser acompanhada por feedback de pessoas que avaliam quão bem o algoritmo produz respostas.

A OpenAI acredita que o uso de imagens para ajustar modelos dará aos desenvolvedores maiores oportunidades para melhorar a compreensão dos algoritmos de IA sobre o que é mostrado nas imagens. Os aplicativos criados dessa forma podem atuar, por exemplo, como uma busca avançada por elementos visuais. Além disso, a OpenAI introduziu uma ferramenta que permitirá que modelos menores de IA aprendam com modelos maiores, bem como “Fast Caching”, que reduzirá significativamente os custos de desenvolvimento ao reutilizar fragmentos de texto previamente processados ​​pelo algoritmo. Todas as inovações apresentadas já estão sendo testadas com um número limitado de clientes OpenAI.

avalanche

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

15 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

15 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

16 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

16 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

16 horas atrás