OpenAI abriu a IA de fala do ChatGPT para desenvolvedores terceirizados – estamos aguardando uma onda de aplicativos falantes

OpenAI introduziu novos recursos para simplificar o processo de criação de aplicativos baseados em inteligência artificial. Os desenvolvedores agora podem usar uma ferramenta online para criar soluções de IA baseadas em voz usando um único conjunto de instruções.

Fonte da imagem: OpenAI

A OpenAI obtém a maior parte de sua receita de empresas que usam as redes neurais da empresa para criar seus próprios aplicativos de IA. Expandir a capacidade de criar tais produtos faz sentido à medida que a batalha da IA ​​se intensifica com empresas como o Google introduzindo algoritmos em seus produtos que podem processar diferentes tipos de informações, incluindo texto, imagens e vídeo.

O processo de criação de assistentes de voz exige que os desenvolvedores passem por pelo menos três etapas: conversão de áudio em texto, processamento da solicitação e geração de uma resposta em texto e conversão da resposta recebida em áudio. Como parte da implementação de novos recursos para a criação de aplicativos de IA de voz, a OpenAI introduziu uma ferramenta para ajustar grandes modelos de linguagem após concluir a fase de treinamento. Essa abordagem melhorará a qualidade das respostas que os algoritmos criados pelos desenvolvedores geram em resposta a consultas em formato de texto e usando imagens. A fase de ajuste fino pode ser acompanhada por feedback de pessoas que avaliam quão bem o algoritmo produz respostas.

A OpenAI acredita que o uso de imagens para ajustar modelos dará aos desenvolvedores maiores oportunidades para melhorar a compreensão dos algoritmos de IA sobre o que é mostrado nas imagens. Os aplicativos criados dessa forma podem atuar, por exemplo, como uma busca avançada por elementos visuais. Além disso, a OpenAI introduziu uma ferramenta que permitirá que modelos menores de IA aprendam com modelos maiores, bem como “Fast Caching”, que reduzirá significativamente os custos de desenvolvimento ao reutilizar fragmentos de texto previamente processados ​​pelo algoritmo. Todas as inovações apresentadas já estão sendo testadas com um número limitado de clientes OpenAI.

avalanche

Postagens recentes

A Samsung fez concessões ao maior sindicato, que realizou uma greve em massa no verão

A Samsung Electronics anunciou hoje que chegou a um acordo preliminar com a Samsung Electronics…

10 minutos atrás

Thunderful Group esclareceu quando o filme de ação retro-futurista Substituído será lançado

A holding sueca Thunderful Group, que inclui os dois editores (Coatsink e Thunderful) do jogo…

10 minutos atrás

O alfa aberto de Rue Valley, um RPG baseado em uma história com elementos de Disco Elysium e Groundhog Day, foi lançado no Steam.

A editora Owlcat Games e os desenvolvedores do Serbian Emotion Spark Studio anunciaram o início…

50 minutos atrás

A Apple lançou o editor de vídeo Final Cut Pro 11, rico em recursos de IA

Mais de uma década após o lançamento do editor de vídeo Final Cut Pro X,…

1 hora atrás

O Wi-Fi 8 está chegando: quando aparecerá e o que oferecerá em vez de maior velocidade?

Especialistas na área de tecnologias sem fio já estão desenvolvendo uma nova geração de comunicações…

2 horas atrás