A Databricks lançou um modelo de AI totalmente gratuito e aberto Dolly para criar análogos do chatbot ChatGPT

O provedor de soluções de análise de big data e aprendizado de máquina Databricks (EUA) anunciou o lançamento do Dolly 2.0, um modelo de inteligência artificial (IA) geradora de próxima geração de código aberto que possui recursos semelhantes ao ChatGPT (OpenAI).

O Dolly 2.0, como seu antecessor Dolly, lançado há algumas semanas, usa um conjunto de dados menor do que a maioria dos modelos de linguagem grandes (LLMs). O Dolly tinha 6 bilhões de parâmetros, enquanto o Dolly 2.0 tem o dobro – 12 bilhões. Para comparação, o GPT-3 tem 175 bilhões de parâmetros. O Dolly 2.0 foi supostamente construído em um conjunto de dados de alta qualidade.

Um grande recurso dos novos modelos de IA generativa é a capacidade de usar seu próprio conjunto de dados de treinamento para criar frases coesas e responder às perguntas do usuário. E o Dolly 2.0 pode fazer isso mesmo com muito menos entrada do que os modelos OpenAI. Isso, por sua vez, permite que você use o modelo em seus próprios servidores sem precisar compartilhar dados com terceiros.

Fonte: Databricks

«Acreditamos que modelos como o Dolly ajudarão a democratizar o LLM de algo que poucas empresas podem pagar para uma mercadoria que toda empresa pode possuir e personalizar para melhorar seus produtos”, disse Databricks. Um executivo da Databricks disse à SiliconANGLE que as empresas “podem monetizar o Dolly 2.0”.

Fonte: Databricks

A Databricks oferece o Dolly 2.0 sob uma licença Creative Commons, um conjunto de dados de treinamento databricks-dolly-15k totalmente aberto que contém 15.000 pares de consulta/resposta criados por humanos de alta qualidade. Tudo isso pode ser usado livremente, modificado e complementado, bem como usado em projetos comerciais sem pagar nada a ninguém. Pesquisadores e desenvolvedores podem acessar o Dolly 2.0 no Hugging Face e no GitHub.

De acordo com a Databricks, o Dolly 2.0 é atualmente o único modelo que não possui restrições de licença. Outros modelos, incluindo Alpaca, Koala, GPT4All e Vicuna, não podem ser usados ​​para fins comerciais devido ao uso de dados de treinamento fornecidos a eles em determinadas condições.

A versão original do Dolly foi treinada em dados Stanford Alpaca usando a API OpenAI, portanto não poderia ser usada para fins comerciais, pois neste caso as licenças proíbem a criação de modelos concorrentes. Portanto, a Databricks decidiu criar seu próprio modelo, usando apenas as respostas de seus funcionários. As tarefas para eles incluíam, por exemplo, pedidos para falar sobre o tema “Por que as pessoas gostam de comédias?”, Resumir informações da Wikipedia, escrever cartas de amor, poemas e até canções.

avalanche

Postagens recentes

O ambicioso jogo de ação furtiva Thick as Thieves, do criador de Deus Ex e System Shock, custará apenas US$ 5 no lançamento, mas há um porém.

O estúdio americano OtherSide Entertainment, com o apoio da Megabit Publishing, confirmou o preço e…

2 horas atrás

A Casa Branca está resistindo aos planos da Anthropic de expandir o acesso ao seu modelo de IA Mythos.

A Anthropic, empresa criadora do modelo de IA Mythos para detecção de vulnerabilidades em sistemas…

4 horas atrás

O lucro operacional da divisão de semicondutores da Samsung aumentou 54 vezes.

O boom da IA ​​continua a ter um impacto marcadamente positivo nos fabricantes de chips…

5 horas atrás

A receita do Game Pass aumentou 1%, enquanto as vendas de consoles caíram quase 30%.

A Microsoft apresentou os resultados financeiros do primeiro trimestre do ano fiscal de 2026, destacando…

6 horas atrás

A Intel apresentou a memória HB3DM, uma “matadora” de HBM com largura de banda superior.

A Saimemory, uma startup cofundada pela Intel, SoftBank e Universidade de Tóquio, está desenvolvendo uma…

10 horas atrás