Categorias: Notícias da rede

Cientistas resolveram um dos principais problemas dos modelos de IA: criaram a primeira IA com memória “infinita”.

Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) resolveram de forma elegante um dos principais problemas da IA: as limitações da janela de contexto. O LLM normalmente opera com centenas ou milhares de tokens, o que o impede de processar completamente arquivos de múltiplos volumes. O novo modelo recursivo supera essa desvantagem usando um sistema de navegação baseado em contexto em vez de memória.

Fonte da imagem: The Neuron

A nova abordagem é implementada na arquitetura do Modelo de Linguagem Recursivo (RLM). Os modelos de linguagem tradicionais de grande porte retêm todas as informações relevantes dentro de uma chamada janela de contexto, com um número bastante rígido e limitado de tokens, e perdem rapidamente a precisão de suas inferências quando o volume de dados de entrada excede esse limite. O modelo RLM oferece uma abordagem diferente: em vez de tentar memorizar os dados de origem em sua totalidade, ele os visualiza como um espaço externo que pode ser navegado e do qual fragmentos relevantes podem ser recuperados conforme necessário. A navegação substitui a memória.

A principal diferença entre o RLM e o LLM é que o mecanismo de recuperação de informações se torna dinâmico e recursivo (com aninhamento, como na estrutura em árvore das pastas do sistema de arquivos). O modelo analisa a consulta, gera uma ação de busca, recupera os segmentos de dados necessários e repete o processo até que uma profundidade de compreensão especificada seja alcançada. Como resultado, a arquitetura é capaz de trabalhar com arrays de dados dezenas ou centenas de vezes maiores do que a capacidade da janela de contexto tradicional, sem um aumento excessivo nos recursos computacionais.

A tecnologia proposta abre novas possibilidades para áreas que exigem o processamento de grandes documentos ou dados estruturados complexos. Por exemplo, na prática jurídica, a IA poderá analisar processos judiciais completos, e não apenas fragmentos individuais; na programação, poderá processar grandes volumes de código; e na análise de dados, poderá combinar e comparar inúmeras publicações científicas sem pré-processamento. A capacidade do modelo de funcionarTrabalhar com conjuntos de dados em larga escala reduz o risco de distorções factuais e erros associados à “perda” de contexto devido à sua exclusão da memória do modelo em algum momento.

Especialistas do MIT forneceram uma biblioteca completa que implementa os princípios do Modelo de Linguagem Recursivo (RLM) e um código de referência mínimo, o que simplificará a familiarização com a tecnologia para todas as partes interessadas e acelerará sua adoção. Algumas empresas já começaram a adaptar a arquitetura para seus produtos, confirmando ainda mais a aplicabilidade do RLM além do laboratório. Assim, os Modelos de Linguagem Recursivos podem se tornar um passo significativo na evolução das arquiteturas de redes neurais, pois oferecem não um aumento na memória do modelo, mas uma maneira fundamentalmente nova de trabalhar com grandes conjuntos de dados.

admin

Próximo A alfândega chinesa negou a entrada de placas gráficas Nvidia H200. »

Anterior « O VoidLink, um vírus modular perigoso para Linux, foi descoberto.

Deixar comentário

Publicado por

admin

3 meses atrás

Postagens recentes

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

Aproveitando o boom da IA, o lucro operacional da SK Hynix deverá quintuplicar este ano, superando o da Microsoft e do Google.

O progresso da concorrente Samsung Electronics no domínio da produção de HBM4 não deve impedir…

6 horas atrás

Notícias da rede

A Rockstar confirmou um vazamento de dados através da plataforma de análise de IA de terceiros, Anodot.

A Rockstar Games confirmou que dados corporativos foram comprometidos em decorrência de um ataque hacker…

6 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O fundador da DeepSeek anunciou a data de lançamento do modelo principal V4.

O fundador da DeepSeek, Liang Wenfeng, confirmou durante uma reunião interna com funcionários que o…

6 horas atrás

Notícias e análises financeiras

Cientistas e engenheiros chineses estão retornando em massa dos Estados Unidos para seus países de origem.

Segundo o Financial Times, os principais polos industriais da China têm testemunhado uma tendência característica…

6 horas atrás

Carros, motos, veículos

A autoridade reguladora holandesa aprovou o software de direção autônoma da Tesla no país.

A agência reguladora holandesa RDW aprovou o sistema de condução parcialmente automatizada da Tesla, conhecido…

7 horas atrás

Aplicativos Android

O WhatsApp enfrenta processos judiciais de usuários e críticas de Musk e Durov devido a problemas de criptografia de ponta a ponta.

O WhatsApp, sua proprietária Meta✴ e a consultoria Accenture foram citados como réus em uma…

7 horas atrás

Cientistas resolveram um dos principais problemas dos modelos de IA: criaram a primeira IA com memória “infinita”.

Conteúdo relacionado

Postagens recentes

Aproveitando o boom da IA, o lucro operacional da SK Hynix deverá quintuplicar este ano, superando o da Microsoft e do Google.

A Rockstar confirmou um vazamento de dados através da plataforma de análise de IA de terceiros, Anodot.

O fundador da DeepSeek anunciou a data de lançamento do modelo principal V4.

Cientistas e engenheiros chineses estão retornando em massa dos Estados Unidos para seus países de origem.

A autoridade reguladora holandesa aprovou o software de direção autônoma da Tesla no país.

O WhatsApp enfrenta processos judiciais de usuários e críticas de Musk e Durov devido a problemas de criptografia de ponta a ponta.