Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

DeepSeek descobre como melhorar o desempenho de modelos de IA com autoaprendizagem

A startup chinesa DeepSeek ganhou as manchetes no início deste ano quando lançou seu modelo de raciocínio R1, que foi capaz de competir com modelos de IA de gigantes da tecnologia americana, apesar de seu orçamento modesto. Agora, a DeepSeek publicou um artigo em colaboração com pesquisadores da Universidade Tsinghua detalhando uma nova abordagem para treinar modelos de reforço que podem melhorar significativamente seu desempenho. Isso foi relatado pelo recurso SCMP.

Fonte da imagem: Solen Feyissa/unsplash.com

De acordo com a publicação, o novo método visa ajudar os modelos de IA a corresponderem melhor às preferências humanas usando um mecanismo de recompensa para respostas mais precisas e compreensíveis. O aprendizado por reforço provou ser eficaz na aceleração da resolução de problemas de IA em domínios e aplicações limitados. No entanto, seu uso para tarefas mais gerais provou ser menos eficaz. A equipe do DeepSeek está tentando resolver esse problema combinando modelagem de recompensa generativa (GRM) e o chamado ajuste de autocrítica baseado em princípios. Conforme afirmado no artigo, uma nova abordagem para melhorar as capacidades de raciocínio de grandes modelos de linguagem (LLMs) superou os métodos existentes, conforme verificado pela validação do modelo em vários benchmarks, e alcançou o mais alto desempenho para consultas gerais usando menos recursos computacionais.

Os novos modelos são chamados DeepSeek-GRM, uma abreviação de Generalist Reward Modeling. A empresa disse que os novos modelos serão de código aberto, mas nenhuma data de lançamento foi anunciada ainda. No mês passado, a Reuters informou, citando pessoas familiarizadas com o assunto, que a empresa também lançaria o DeepSeek-R2, um sucessor do modelo de raciocínio R1, em abril.

Outros desenvolvedores líderes de IA, incluindo o Alibaba Group Holding da China e a OpenAI, sediada em São Francisco, também estão trabalhando para melhorar o raciocínio e as capacidades de autoaperfeiçoamento dos modelos de IA, observou a Bloomberg.

avalanche

Próximo A Apple envia aviões carregados de iPhones e gadgets da Índia e da China para vencer os aumentos de tarifas dos EUA »

Anterior « Neverwinter Nights 2: Enhanced Edition agora é totalmente compatível com o Steam Deck, embora ainda não tenha sido anunciado oficialmente

Deixar comentário

Publicado por

avalanche

1 ano atrás

Postagens recentes

Jogos

“Não tínhamos dúvidas de que esse dia chegaria”: o filme de terror Cronos: The New Dawn, dos criadores do remake de Silent Hill 2, alcançou um “marco comercial importante”.

O estúdio polonês Bloober Team (responsável pelo remake de Silent Hill 2) informou aos investidores…

21 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O CEO do Google DeepMind define cronograma para Inteligência Artificial Geral (AGI) e explica como os humanos podem competir com a IA.

O CEO do Google DeepMind, Demis Hassabis, reiterou sua previsão de alcançar a inteligência artificial…

1 hora atrás

Discos rígidos, sistemas de armazenamento, interfaces, NAS

A Xiaomi anunciou seu primeiro NAS Smart Storage, mas é possível que ele não seja lançado.

A Xiaomi apresentou seu primeiro dispositivo de armazenamento em rede, o Smart Storage, na China,…

1 hora atrás

Rumores

Os chips ficarão ainda mais caros: a TSMC aumentou novamente os preços de produção utilizando tecnologias de processo avançadas.

Em abril deste ano, durante um simpósio de tecnologia corporativa na Califórnia, conforme observado pela…

1 hora atrás

Jogos

O jogo de terror arrepiante Unhinged, dos criadores de Oxenfree, é uma exclusividade da Netflix – data de lançamento e trailer de gameplay revelados.

A gigante do streaming Netflix revelou o próximo jogo de seu estúdio americano, Night School…

1 hora atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Os usuários estão abandonando o Google: alguns para o ChatGPT, outros para buscas sem inteligência artificial.

Mais de três anos após o boom da IA, o Google conseguiu desmentir a ideia…

3 horas atrás

DeepSeek descobre como melhorar o desempenho de modelos de IA com autoaprendizagem

Conteúdo relacionado

Postagens recentes

“Não tínhamos dúvidas de que esse dia chegaria”: o filme de terror Cronos: The New Dawn, dos criadores do remake de Silent Hill 2, alcançou um “marco comercial importante”.

O CEO do Google DeepMind define cronograma para Inteligência Artificial Geral (AGI) e explica como os humanos podem competir com a IA.

A Xiaomi anunciou seu primeiro NAS Smart Storage, mas é possível que ele não seja lançado.

Os chips ficarão ainda mais caros: a TSMC aumentou novamente os preços de produção utilizando tecnologias de processo avançadas.

O jogo de terror arrepiante Unhinged, dos criadores de Oxenfree, é uma exclusividade da Netflix – data de lançamento e trailer de gameplay revelados.

Os usuários estão abandonando o Google: alguns para o ChatGPT, outros para buscas sem inteligência artificial.