O provedor de soluções de análise de big data e aprendizado de máquina Databricks (EUA) anunciou o lançamento do Dolly 2.0, um modelo de inteligência artificial (IA) geradora de próxima geração de código aberto que possui recursos semelhantes ao ChatGPT (OpenAI).
O Dolly 2.0, como seu antecessor Dolly, lançado há algumas semanas, usa um conjunto de dados menor do que a maioria dos modelos de linguagem grandes (LLMs). O Dolly tinha 6 bilhões de parâmetros, enquanto o Dolly 2.0 tem o dobro – 12 bilhões. Para comparação, o GPT-3 tem 175 bilhões de parâmetros. O Dolly 2.0 foi supostamente construído em um conjunto de dados de alta qualidade.
Um grande recurso dos novos modelos de IA generativa é a capacidade de usar seu próprio conjunto de dados de treinamento para criar frases coesas e responder às perguntas do usuário. E o Dolly 2.0 pode fazer isso mesmo com muito menos entrada do que os modelos OpenAI. Isso, por sua vez, permite que você use o modelo em seus próprios servidores sem precisar compartilhar dados com terceiros.
«Acreditamos que modelos como o Dolly ajudarão a democratizar o LLM de algo que poucas empresas podem pagar para uma mercadoria que toda empresa pode possuir e personalizar para melhorar seus produtos”, disse Databricks. Um executivo da Databricks disse à SiliconANGLE que as empresas “podem monetizar o Dolly 2.0”.
A Databricks oferece o Dolly 2.0 sob uma licença Creative Commons, um conjunto de dados de treinamento databricks-dolly-15k totalmente aberto que contém 15.000 pares de consulta/resposta criados por humanos de alta qualidade. Tudo isso pode ser usado livremente, modificado e complementado, bem como usado em projetos comerciais sem pagar nada a ninguém. Pesquisadores e desenvolvedores podem acessar o Dolly 2.0 no Hugging Face e no GitHub.
De acordo com a Databricks, o Dolly 2.0 é atualmente o único modelo que não possui restrições de licença. Outros modelos, incluindo Alpaca, Koala, GPT4All e Vicuna, não podem ser usados para fins comerciais devido ao uso de dados de treinamento fornecidos a eles em determinadas condições.
A versão original do Dolly foi treinada em dados Stanford Alpaca usando a API OpenAI, portanto não poderia ser usada para fins comerciais, pois neste caso as licenças proíbem a criação de modelos concorrentes. Portanto, a Databricks decidiu criar seu próprio modelo, usando apenas as respostas de seus funcionários. As tarefas para eles incluíam, por exemplo, pedidos para falar sobre o tema “Por que as pessoas gostam de comédias?”, Resumir informações da Wikipedia, escrever cartas de amor, poemas e até canções.
A Huawei espera que o número de aplicações para a sua plataforma de software HarmonyOS…
Uma década depois de o herdeiro de terceira geração da Samsung, Lee Jae-yong, ter assumido…
Há exatos 20 anos, em 23 de novembro de 2004, World of Warcraft foi lançado,…
A Xiaomi chama a atenção dos usuários para seus novos smartphones Xiaomi 14T Pro, Xiaomi…
Um novo relatório de analistas da iSeeCars mostrou que, entre as marcas de automóveis, os…
Tronsmart oferece aos usuários uma variedade de alto-falantes Bluetooth, incluindo Halo 200, Mirtune S100 e…