OpenAI abriu a IA de fala do ChatGPT para desenvolvedores terceirizados – estamos aguardando uma onda de aplicativos falantes

OpenAI introduziu novos recursos para simplificar o processo de criação de aplicativos baseados em inteligência artificial. Os desenvolvedores agora podem usar uma ferramenta online para criar soluções de IA baseadas em voz usando um único conjunto de instruções.

Fonte da imagem: OpenAI

A OpenAI obtém a maior parte de sua receita de empresas que usam as redes neurais da empresa para criar seus próprios aplicativos de IA. Expandir a capacidade de criar tais produtos faz sentido à medida que a batalha da IA ​​se intensifica com empresas como o Google introduzindo algoritmos em seus produtos que podem processar diferentes tipos de informações, incluindo texto, imagens e vídeo.

O processo de criação de assistentes de voz exige que os desenvolvedores passem por pelo menos três etapas: conversão de áudio em texto, processamento da solicitação e geração de uma resposta em texto e conversão da resposta recebida em áudio. Como parte da implementação de novos recursos para a criação de aplicativos de IA de voz, a OpenAI introduziu uma ferramenta para ajustar grandes modelos de linguagem após concluir a fase de treinamento. Essa abordagem melhorará a qualidade das respostas que os algoritmos criados pelos desenvolvedores geram em resposta a consultas em formato de texto e usando imagens. A fase de ajuste fino pode ser acompanhada por feedback de pessoas que avaliam quão bem o algoritmo produz respostas.

A OpenAI acredita que o uso de imagens para ajustar modelos dará aos desenvolvedores maiores oportunidades para melhorar a compreensão dos algoritmos de IA sobre o que é mostrado nas imagens. Os aplicativos criados dessa forma podem atuar, por exemplo, como uma busca avançada por elementos visuais. Além disso, a OpenAI introduziu uma ferramenta que permitirá que modelos menores de IA aprendam com modelos maiores, bem como “Fast Caching”, que reduzirá significativamente os custos de desenvolvimento ao reutilizar fragmentos de texto previamente processados ​​pelo algoritmo. Todas as inovações apresentadas já estão sendo testadas com um número limitado de clientes OpenAI.

avalanche

Postagens recentes

“Os fãs de Skyrim e Fallout 76 se sentirão em casa”: jogo de ação e terror The Axis Unseen, de ex-artista da Bethesda, recebeu demo e data de lançamento

O desenvolvedor solitário Nate Purkeypile, ex-artista principal da Bethesda Game Studios, lançou uma demonstração gratuita…

14 minutos atrás

A Microsoft lançou o Office 2024 para PC e Mac, que funciona sem assinatura

A Microsoft lançou uma nova versão do pacote Office para clientes que não desejam assinar…

28 minutos atrás

Lian Li apresentou um case compacto mas espaçoso Lancool 207

Lian Li lançou um gabinete torre média Lancool 207 ventilado. As dimensões do novo produto…

44 minutos atrás

Adobe lança Photoshop e Premiere Elements 2025 com recursos avançados de IA e preço de US$ 90

Photoshop Elements e Premiere Elements são versões leves do software de edição de imagens e…

1 hora atrás