A Stability AI publicou um conjunto de pequenas redes neurais StableLM de código aberto para competir com o GPT-4

A Startup Stability AI, que desenvolveu a rede neural Stable Diffusion de código aberto capaz de gerar imagens em texto, lançou um conjunto de modelos de IA de geração de texto StableLM de código aberto projetados para competir com grandes modelos de linguagem, como o GPT-4 da OpenAI.

Fonte da imagem: Pixabay

Disponível em “alfa” no GitHub e no Hugging Spaces, o conjunto de modelos StableLM de 3 e 7 bilhões de parâmetros pode gerar texto e código e “demonstrar como modelos pequenos e eficientes podem oferecer alto desempenho quando treinados adequadamente”.

«Os modelos de linguagem serão a espinha dorsal de nossa economia digital e queremos que todos tenham voz em seu desenvolvimento”, escreveu a equipe Stability AI em um post de blog no site da empresa.

Fonte da imagem: Stability AI

O conjunto StableLM foi treinado em um novo conjunto de dados experimental construído no The Pile, mas três vezes maior, com 1,5 trilhão de tokens de conteúdo. A Stability AI não disse se os modelos StableLM têm os mesmos problemas que outros modelos de linguagem, ou seja, uma tendência a gerar respostas tóxicas para certas perguntas e inventar fatos falsos. Mas, dado que The Pile contém linguagem obscena e bastante dura, pode muito bem ser.

«Como é o caso de qualquer modelo de linguagem grande pré-treinado sem ajuste fino adicional e aprendizado de reforço, as respostas que o usuário recebe podem ser de qualidade variável e podem incluir linguagem e visualizações ofensivas, escreveu Stability AI. “Espera-se que isso seja corrigido por meio de dimensionamento, melhores dados, feedback da comunidade e otimizações.”

No entanto, quando ajustados usando a metodologia Alpaca de Stanford em conjuntos de dados de código aberto, incluindo os da startup de IA Anthropic, os modelos StableLM se comportam como ChatGPT, respondendo a solicitações (às vezes com humor) como “escreva uma carta de apresentação para um desenvolvedor de software” e ” escreva letras para uma batalha épica de rap.”

Embora alguns especialistas critiquem os modelos de código aberto, argumentando que eles podem ser usados ​​para fins duvidosos, como criar e-mails de phishing ou apoiar ataques de malware. Mas a Stability AI afirma que o código aberto é realmente a abordagem certa. “O acesso aberto e granular aos nossos modelos permite que a pesquisa mais ampla e a comunidade acadêmica desenvolvam métodos de interpretação e segurança que vão além do que é possível com modelos fechados”, disse a empresa.

No entanto, vários processos foram movidos contra a Stability AI, acusando-a de infringir os direitos autorais de milhões de artistas ao desenvolver o Stable Diffusion usando imagens protegidas por direitos de propriedade intelectual.

avalanche

Postagens recentes

O PS5, o PS5 Pro e o PlayStation Portal estão prestes a sofrer um aumento considerável de preço – a Sony está elevando os preços em todo o mundo.

Na sequência de rumores recentes, a Sony Interactive Entertainment, detentora da plataforma japonesa, anunciou oficialmente…

18 minutos atrás

Imagens do Motorola Razr 70 Ultra apareceram – e, por algum motivo, ele ficou maior.

A Motorola está se preparando para lançar um smartphone topo de linha com formato dobrável…

32 minutos atrás

O Google apresentou uma inteligência artificial capaz de criar aplicativos para headsets de realidade estendida em menos de um minuto.

O Google apresentou o Vibe Coding XR, uma solução de IA que reduz o processo…

32 minutos atrás

Um veterano da Microsoft explicou como o Windows 95 lidava de forma fácil e discreta com desenvolvedores preguiçosos.

Em outra entrevista, o veterano engenheiro de software da Microsoft, Raymond Chen, descreveu como o…

32 minutos atrás

O segundo centro de dados da Wildberries foi inaugurado em Dubna.

A RWB, mais conhecida por seu marketplace Wildberries, inaugurou seu segundo data center na região…

1 hora atrás

Colliers: O investimento em data centers superou o investimento no setor petrolífero pela primeira vez, mas os riscos permanecem.

Segundo a Colliers, o investimento global em data centers ultrapassará US$ 580 bilhões em 2025,…

1 hora atrás