OpenAI abriu a IA de fala do ChatGPT para desenvolvedores terceirizados – estamos aguardando uma onda de aplicativos falantes

OpenAI introduziu novos recursos para simplificar o processo de criação de aplicativos baseados em inteligência artificial. Os desenvolvedores agora podem usar uma ferramenta online para criar soluções de IA baseadas em voz usando um único conjunto de instruções.

Fonte da imagem: OpenAI

A OpenAI obtém a maior parte de sua receita de empresas que usam as redes neurais da empresa para criar seus próprios aplicativos de IA. Expandir a capacidade de criar tais produtos faz sentido à medida que a batalha da IA ​​se intensifica com empresas como o Google introduzindo algoritmos em seus produtos que podem processar diferentes tipos de informações, incluindo texto, imagens e vídeo.

O processo de criação de assistentes de voz exige que os desenvolvedores passem por pelo menos três etapas: conversão de áudio em texto, processamento da solicitação e geração de uma resposta em texto e conversão da resposta recebida em áudio. Como parte da implementação de novos recursos para a criação de aplicativos de IA de voz, a OpenAI introduziu uma ferramenta para ajustar grandes modelos de linguagem após concluir a fase de treinamento. Essa abordagem melhorará a qualidade das respostas que os algoritmos criados pelos desenvolvedores geram em resposta a consultas em formato de texto e usando imagens. A fase de ajuste fino pode ser acompanhada por feedback de pessoas que avaliam quão bem o algoritmo produz respostas.

A OpenAI acredita que o uso de imagens para ajustar modelos dará aos desenvolvedores maiores oportunidades para melhorar a compreensão dos algoritmos de IA sobre o que é mostrado nas imagens. Os aplicativos criados dessa forma podem atuar, por exemplo, como uma busca avançada por elementos visuais. Além disso, a OpenAI introduziu uma ferramenta que permitirá que modelos menores de IA aprendam com modelos maiores, bem como “Fast Caching”, que reduzirá significativamente os custos de desenvolvimento ao reutilizar fragmentos de texto previamente processados ​​pelo algoritmo. Todas as inovações apresentadas já estão sendo testadas com um número limitado de clientes OpenAI.

avalanche

Postagens recentes

Análise do HUAWEI MatePad Pro 12.2” PaperMatte: tablet com tela dupla

A Apple lançou o primeiro tablet com tela Tandem OLED de camada dupla este ano…

50 minutos atrás

O diretor de Baldur’s Gate 3 sugeriu quando o próximo jogo de Larian será lançado, mas depois voltou atrás

O chefe da Larian Studios, Swen Vincke, durante a cerimônia SEA Game Awards 2024 e…

1 hora atrás

A Microsoft alertou que a atualização 24H2 do Windows 11 está causando problemas em alguns jogos

A Microsoft bloqueou a instalação da atualização do Windows 24H2 para alguns sistemas devido aos…

1 hora atrás

Os jogadores estão cada vez mais escolhendo jogos indie e não querem perder tempo em enormes mundos abertos

A indústria de jogos está cansada de projetos de grande escala. Pequenos jogos que economizam…

2 horas atrás

A desativação de um sensor inútil acrescentou anos à sonda Voyager 2 da NASA no espaço profundo

Os especialistas da NASA desligaram um dos instrumentos científicos da sonda Voyager 2, cuja produtividade…

3 horas atrás