A Databricks lançou um modelo de AI totalmente gratuito e aberto Dolly para criar análogos do chatbot ChatGPT

O provedor de soluções de análise de big data e aprendizado de máquina Databricks (EUA) anunciou o lançamento do Dolly 2.0, um modelo de inteligência artificial (IA) geradora de próxima geração de código aberto que possui recursos semelhantes ao ChatGPT (OpenAI).

O Dolly 2.0, como seu antecessor Dolly, lançado há algumas semanas, usa um conjunto de dados menor do que a maioria dos modelos de linguagem grandes (LLMs). O Dolly tinha 6 bilhões de parâmetros, enquanto o Dolly 2.0 tem o dobro – 12 bilhões. Para comparação, o GPT-3 tem 175 bilhões de parâmetros. O Dolly 2.0 foi supostamente construído em um conjunto de dados de alta qualidade.

Um grande recurso dos novos modelos de IA generativa é a capacidade de usar seu próprio conjunto de dados de treinamento para criar frases coesas e responder às perguntas do usuário. E o Dolly 2.0 pode fazer isso mesmo com muito menos entrada do que os modelos OpenAI. Isso, por sua vez, permite que você use o modelo em seus próprios servidores sem precisar compartilhar dados com terceiros.

Fonte: Databricks

«Acreditamos que modelos como o Dolly ajudarão a democratizar o LLM de algo que poucas empresas podem pagar para uma mercadoria que toda empresa pode possuir e personalizar para melhorar seus produtos”, disse Databricks. Um executivo da Databricks disse à SiliconANGLE que as empresas “podem monetizar o Dolly 2.0”.

Fonte: Databricks

A Databricks oferece o Dolly 2.0 sob uma licença Creative Commons, um conjunto de dados de treinamento databricks-dolly-15k totalmente aberto que contém 15.000 pares de consulta/resposta criados por humanos de alta qualidade. Tudo isso pode ser usado livremente, modificado e complementado, bem como usado em projetos comerciais sem pagar nada a ninguém. Pesquisadores e desenvolvedores podem acessar o Dolly 2.0 no Hugging Face e no GitHub.

De acordo com a Databricks, o Dolly 2.0 é atualmente o único modelo que não possui restrições de licença. Outros modelos, incluindo Alpaca, Koala, GPT4All e Vicuna, não podem ser usados ​​para fins comerciais devido ao uso de dados de treinamento fornecidos a eles em determinadas condições.

A versão original do Dolly foi treinada em dados Stanford Alpaca usando a API OpenAI, portanto não poderia ser usada para fins comerciais, pois neste caso as licenças proíbem a criação de modelos concorrentes. Portanto, a Databricks decidiu criar seu próprio modelo, usando apenas as respostas de seus funcionários. As tarefas para eles incluíam, por exemplo, pedidos para falar sobre o tema “Por que as pessoas gostam de comédias?”, Resumir informações da Wikipedia, escrever cartas de amor, poemas e até canções.

avalanche

Postagens recentes

Não se preocupe com a trilha sonora: o compositor de The Witcher 3 escreverá músicas para The Witcher 4.

O estúdio polonês CD Projekt Red não tem pressa em compartilhar detalhes sobre o aguardado…

1 hora atrás

A Microsoft restaurou o ícone de login por senha na tela de bloqueio do Windows 11, que havia desaparecido em agosto.

Seis meses depois, a Microsoft corrigiu um problema conhecido em que a opção de login…

4 horas atrás

Uma fonte interna decepcionou os fãs que esperavam ver Ada Wong e Chris Redfield em Resident Evil Requiem.

O lançamento do ambicioso jogo de terror Resident Evil Requiem marcará o grande retorno do…

8 horas atrás

O Samsung Galaxy S26 Ultra com caneta stylus aparece em imagem de pré-anúncio.

No final de janeiro, foi noticiado que os smartphones da série Samsung Galaxy S26 provavelmente…

10 horas atrás

“Vivo e bem”: Um analista de dados revelou o que está acontecendo com Half-Life 3.

O minerador de dados Maxim Poletaev (também conhecido como Gabe Follower) comentou recentemente sobre rumores…

11 horas atrás

A Ford manteve conversas com a Xiaomi sobre a produção de veículos elétricos nos EUA.

A Ford Motor, uma das maiores montadoras americanas, inicialmente se comprometeu com uma estreita cooperação…

12 horas atrás