A Databricks lançou um modelo de AI totalmente gratuito e aberto Dolly para criar análogos do chatbot ChatGPT

O provedor de soluções de análise de big data e aprendizado de máquina Databricks (EUA) anunciou o lançamento do Dolly 2.0, um modelo de inteligência artificial (IA) geradora de próxima geração de código aberto que possui recursos semelhantes ao ChatGPT (OpenAI).

O Dolly 2.0, como seu antecessor Dolly, lançado há algumas semanas, usa um conjunto de dados menor do que a maioria dos modelos de linguagem grandes (LLMs). O Dolly tinha 6 bilhões de parâmetros, enquanto o Dolly 2.0 tem o dobro – 12 bilhões. Para comparação, o GPT-3 tem 175 bilhões de parâmetros. O Dolly 2.0 foi supostamente construído em um conjunto de dados de alta qualidade.

Um grande recurso dos novos modelos de IA generativa é a capacidade de usar seu próprio conjunto de dados de treinamento para criar frases coesas e responder às perguntas do usuário. E o Dolly 2.0 pode fazer isso mesmo com muito menos entrada do que os modelos OpenAI. Isso, por sua vez, permite que você use o modelo em seus próprios servidores sem precisar compartilhar dados com terceiros.

Fonte: Databricks

«Acreditamos que modelos como o Dolly ajudarão a democratizar o LLM de algo que poucas empresas podem pagar para uma mercadoria que toda empresa pode possuir e personalizar para melhorar seus produtos”, disse Databricks. Um executivo da Databricks disse à SiliconANGLE que as empresas “podem monetizar o Dolly 2.0”.

Fonte: Databricks

A Databricks oferece o Dolly 2.0 sob uma licença Creative Commons, um conjunto de dados de treinamento databricks-dolly-15k totalmente aberto que contém 15.000 pares de consulta/resposta criados por humanos de alta qualidade. Tudo isso pode ser usado livremente, modificado e complementado, bem como usado em projetos comerciais sem pagar nada a ninguém. Pesquisadores e desenvolvedores podem acessar o Dolly 2.0 no Hugging Face e no GitHub.

De acordo com a Databricks, o Dolly 2.0 é atualmente o único modelo que não possui restrições de licença. Outros modelos, incluindo Alpaca, Koala, GPT4All e Vicuna, não podem ser usados ​​para fins comerciais devido ao uso de dados de treinamento fornecidos a eles em determinadas condições.

A versão original do Dolly foi treinada em dados Stanford Alpaca usando a API OpenAI, portanto não poderia ser usada para fins comerciais, pois neste caso as licenças proíbem a criação de modelos concorrentes. Portanto, a Databricks decidiu criar seu próprio modelo, usando apenas as respostas de seus funcionários. As tarefas para eles incluíam, por exemplo, pedidos para falar sobre o tema “Por que as pessoas gostam de comédias?”, Resumir informações da Wikipedia, escrever cartas de amor, poemas e até canções.

avalanche

Postagens recentes

Lenovo revela o Legion Go 2, console portátil baseado em SteamOS – uma alternativa de US$ 1.199 ao Steam Deck.

A Lenovo apresentou uma versão do seu console portátil Legion Go 2 rodando o sistema…

1 hora atrás

A Lenovo apresentou um monitor com orientação de jogo baseada em inteligência artificial – o AI Frame Gaming Display.

A Lenovo apresentou um protótipo conceitual do AI Frame Gaming Display, que inclui recursos de…

1 hora atrás

A Lenovo apresentou óculos inteligentes com inteligência artificial que sugerem, traduzem e leem textos diante dos seus olhos.

Na CES 2026, a Lenovo apresentou sua visão para um dispositivo vestível na forma de…

1 hora atrás

Lenovo revela o notebook gamer Legion Pro com tela enrolável de 24 polegadas.

A Lenovo revelou oficialmente o conceito do notebook gamer Legion Pro Rollable. O dispositivo possui…

1 hora atrás

A Lenovo criou um ThinkPad com uma tela “crescente” que também é curvada de dentro para fora.

Na CES 2026, a Lenovo apresenta uma série de conceitos que refletem sua abordagem de…

1 hora atrás