À medida que a concorrência no campo das redes neurais generativas cresce, um dos líderes em face do OpenAI introduziu versões atualizadas de algoritmos de geração de texto e também reduziu o custo de seu uso. A empresa lançou versões atualizadas dos modelos de linguagem GPT-3.5-turbo e GPT-4, que fornecerão ainda mais oportunidades para criação de conteúdo em comparação com as versões anteriores dos modelos de linguagem da startup.

Fonte da imagem: Pixabay

Uma das inovações interessantes foi o surgimento de uma ferramenta que permite aos desenvolvedores descrever as funções do programa em linguagem natural e obter um código completo para executá-las. Por exemplo, esta ferramenta é adequada para criar chatbots que respondem perguntas chamando ferramentas externas, convertendo linguagem natural em consultas de banco de dados e extraindo dados estruturados de texto. Ambos os modelos são capazes de determinar quando uma função deve ser chamada e responder no formato JSON que corresponde à assinatura da função. Essa inovação também permitirá que os desenvolvedores obtenham dados mais precisos e estruturados.

Ao mesmo tempo, o modelo GPR-3.5-turbo recebeu uma janela de contexto expandida (a quantidade de texto considerada no processo de geração). Ampliar a janela de contexto permite que o modelo entenda melhor o significado das consultas e forneça respostas mais relevantes sem se desviar do tópico. O modelo GPR-3.5-turbo possui uma janela de contexto de 16.000 tokens, quatro vezes maior que a do GPT-3.5. Também foi anunciado que a OpenAI está atualmente testando o modelo GPT-4 com uma janela de contexto de 32k tokens.

O custo de uso da versão padrão do GPT-3.5-turbo (sem janela de contexto estendida) foi reduzido em 25% para US$ 0,0015 por 1.000 tokens de entrada e US$ 0,002 por 1.000 tokens de saída, o que corresponde a aproximadamente 700 páginas de texto por US$ 1. O custo de usar o modelo text-embedding-ada-002, que mede a similaridade de texto, foi reduzido em 75% para US$ 0,0001 por 1.000 tokens.

avalanche

Postagens recentes

As comunidades do Reddit estenderam sua greve indefinidamente até que o governo responda às suas demandas.

Na segunda-feira, as comunidades do Reddit entraram em greve, inicialmente prevista para 48 horas, mas…

4 minutos atrás

Coreia do Sul será líder em compras de equipamentos para produção de chips em 2026

A associação industrial SEMI compartilha as preocupações de algumas fontes sobre a redução nas despesas…

13 minutos atrás

1,7 milhão de gigabits por segundo recorde de taxa de dados definido para fibra padrão

Uma equipe internacional de pesquisadores anunciou que alcançou um recorde mundial de velocidade de transferência…

14 minutos atrás

Tribunal dos EUA nega pedido para bloquear ativos da Binance.US

Um juiz federal que considera as reivindicações da Securities and Exchange Commission (SEC) dos EUA…

20 minutos atrás

Empresas russas sancionadas retomarão emissão de endereços IP

O registrador internacional de Internet RIPE NCC anunciou em 12 de junho a retomada dos…

44 minutos atrás