OpenAI abriu a IA de fala do ChatGPT para desenvolvedores terceirizados – estamos aguardando uma onda de aplicativos falantes

OpenAI introduziu novos recursos para simplificar o processo de criação de aplicativos baseados em inteligência artificial. Os desenvolvedores agora podem usar uma ferramenta online para criar soluções de IA baseadas em voz usando um único conjunto de instruções.

Fonte da imagem: OpenAI

A OpenAI obtém a maior parte de sua receita de empresas que usam as redes neurais da empresa para criar seus próprios aplicativos de IA. Expandir a capacidade de criar tais produtos faz sentido à medida que a batalha da IA ​​se intensifica com empresas como o Google introduzindo algoritmos em seus produtos que podem processar diferentes tipos de informações, incluindo texto, imagens e vídeo.

O processo de criação de assistentes de voz exige que os desenvolvedores passem por pelo menos três etapas: conversão de áudio em texto, processamento da solicitação e geração de uma resposta em texto e conversão da resposta recebida em áudio. Como parte da implementação de novos recursos para a criação de aplicativos de IA de voz, a OpenAI introduziu uma ferramenta para ajustar grandes modelos de linguagem após concluir a fase de treinamento. Essa abordagem melhorará a qualidade das respostas que os algoritmos criados pelos desenvolvedores geram em resposta a consultas em formato de texto e usando imagens. A fase de ajuste fino pode ser acompanhada por feedback de pessoas que avaliam quão bem o algoritmo produz respostas.

A OpenAI acredita que o uso de imagens para ajustar modelos dará aos desenvolvedores maiores oportunidades para melhorar a compreensão dos algoritmos de IA sobre o que é mostrado nas imagens. Os aplicativos criados dessa forma podem atuar, por exemplo, como uma busca avançada por elementos visuais. Além disso, a OpenAI introduziu uma ferramenta que permitirá que modelos menores de IA aprendam com modelos maiores, bem como “Fast Caching”, que reduzirá significativamente os custos de desenvolvimento ao reutilizar fragmentos de texto previamente processados ​​pelo algoritmo. Todas as inovações apresentadas já estão sendo testadas com um número limitado de clientes OpenAI.

avalanche

Postagens recentes

Calculadoras termodinâmicas são normais / Inteligência artificial

A IA generativa consome uma quantidade extremamente alta de energia. Uma requisição para Gemini, ChatGPT…

2 horas atrás

As placas-mãe da Gigabyte também receberam suporte para memória HUDIMM de “meio tamanho”.

A Gigabyte lançou atualizações de BIOS para suas placas-mãe Intel das séries 800, 700 e…

2 horas atrás

A Lian Li lança a câmera compacta Vector V150 INF com espelho infinito.

A Lian Li lançou o gabinete Vector V150 INF, relativamente compacto. Embora as dimensões do…

3 horas atrás

A Microsoft iniciou os testes do upscaler universal Auto SR para Windows 11 – atualmente apenas no Xbox Ally X.

A Microsoft começou a testar o recurso de upscaling Auto SR no console portátil Xbox…

5 horas atrás