A Databricks lançou um modelo de AI totalmente gratuito e aberto Dolly para criar análogos do chatbot ChatGPT

O provedor de soluções de análise de big data e aprendizado de máquina Databricks (EUA) anunciou o lançamento do Dolly 2.0, um modelo de inteligência artificial (IA) geradora de próxima geração de código aberto que possui recursos semelhantes ao ChatGPT (OpenAI).

O Dolly 2.0, como seu antecessor Dolly, lançado há algumas semanas, usa um conjunto de dados menor do que a maioria dos modelos de linguagem grandes (LLMs). O Dolly tinha 6 bilhões de parâmetros, enquanto o Dolly 2.0 tem o dobro – 12 bilhões. Para comparação, o GPT-3 tem 175 bilhões de parâmetros. O Dolly 2.0 foi supostamente construído em um conjunto de dados de alta qualidade.

Um grande recurso dos novos modelos de IA generativa é a capacidade de usar seu próprio conjunto de dados de treinamento para criar frases coesas e responder às perguntas do usuário. E o Dolly 2.0 pode fazer isso mesmo com muito menos entrada do que os modelos OpenAI. Isso, por sua vez, permite que você use o modelo em seus próprios servidores sem precisar compartilhar dados com terceiros.

Fonte: Databricks

«Acreditamos que modelos como o Dolly ajudarão a democratizar o LLM de algo que poucas empresas podem pagar para uma mercadoria que toda empresa pode possuir e personalizar para melhorar seus produtos”, disse Databricks. Um executivo da Databricks disse à SiliconANGLE que as empresas “podem monetizar o Dolly 2.0”.

Fonte: Databricks

A Databricks oferece o Dolly 2.0 sob uma licença Creative Commons, um conjunto de dados de treinamento databricks-dolly-15k totalmente aberto que contém 15.000 pares de consulta/resposta criados por humanos de alta qualidade. Tudo isso pode ser usado livremente, modificado e complementado, bem como usado em projetos comerciais sem pagar nada a ninguém. Pesquisadores e desenvolvedores podem acessar o Dolly 2.0 no Hugging Face e no GitHub.

De acordo com a Databricks, o Dolly 2.0 é atualmente o único modelo que não possui restrições de licença. Outros modelos, incluindo Alpaca, Koala, GPT4All e Vicuna, não podem ser usados ​​para fins comerciais devido ao uso de dados de treinamento fornecidos a eles em determinadas condições.

A versão original do Dolly foi treinada em dados Stanford Alpaca usando a API OpenAI, portanto não poderia ser usada para fins comerciais, pois neste caso as licenças proíbem a criação de modelos concorrentes. Portanto, a Databricks decidiu criar seu próprio modelo, usando apenas as respostas de seus funcionários. As tarefas para eles incluíam, por exemplo, pedidos para falar sobre o tema “Por que as pessoas gostam de comédias?”, Resumir informações da Wikipedia, escrever cartas de amor, poemas e até canções.

avalanche

Postagens recentes

O reprodutor de mídia VLC foi baixado 6 bilhões de vezes – em breve terá um gerador de legendas AI

O popular reprodutor de mídia de código aberto VLC, desenvolvido pela organização sem fins lucrativos…

3 minutos atrás

Deep Fission alimentará o data center Endeavour a partir de pequenos reatores nucleares subterrâneos a uma profundidade de mais de 1,5 km

A Deep Fission, que desenvolve pequenos reatores modulares (SMRs), assinou um acordo com o desenvolvedor…

13 minutos atrás

Gigabyte lançará 27 versões de GeForce RTX 5090, RTX 5080, RTX 5070 Ti e RTX 5070

A Gigabyte apresentou um total de 27 variantes de placas de vídeo GeForce RTX 5090,…

1 hora atrás

Anunciantes meta isentos que ganham mais dinheiro com a moderação padrão

Meta✴ isentou alguns dos principais anunciantes em suas plataformas das práticas padrão de moderação de…

2 horas atrás

A Gigabyte apresentou mais de 30 placas-mãe baseadas em Intel B860 e AMD B850 para os processadores mais recentes

A Gigabyte apresentou na CES 2025 uma nova geração de placas-mãe baseadas nos chipsets Intel…

2 horas atrás