Os engenheiros da Apple falaram sobre sua colaboração com a Nvidia, graças à qual conseguiram melhorar o desempenho dos sistemas na geração de texto a partir de grandes modelos de linguagem de inteligência artificial.

Fonte da imagem: desenvolvedor.nvidia.com

Este ano, a Apple publicou o código-fonte de seu Recurrent Drafter (ReDrafter), um novo método para gerar texto usando grandes modelos de linguagem. Caracteriza-se pela alta velocidade, combinando duas tecnologias: busca por feixe e árvore de atenção dinâmica. O projeto de pesquisa da Apple mostrou resultados convincentes, mas a implantação do ReDrafter integrou a tecnologia ao sistema TensorRT-LLM da Nvidia, uma ferramenta que permite que grandes modelos de linguagem sejam executados mais rapidamente em aceleradores Nvidia.

As medições de desempenho mostraram que ao executar grandes modelos de linguagem com dezenas de bilhões de parâmetros usando a estrutura Nvidia TensorRT-LLM e ReDrafter, a velocidade de geração de token aumentou 2,7 vezes. Assim, a tecnologia permite reduzir o atraso entre o usuário inserir uma solicitação e receber uma resposta do modelo – ao mesmo tempo em que utiliza menos aceleradores e reduz o consumo de energia, concluíram os engenheiros da Apple.

«Grandes modelos de linguagem são cada vez mais usados ​​em aplicativos, e melhorar a eficiência da inferência pode impactar os custos computacionais e reduzir a latência para os usuários. Com a nova abordagem do ReDrafter para execução especulativa integrada à estrutura Nvidia TensorRT-LLM, os desenvolvedores agora podem gerar tokens mais rapidamente em aceleradores Nvidia para seus aplicativos”, acrescentou Apple.

avalanche

Postagens recentes

Os cientistas se inspiraram no peneireiro-vulgar e desenvolverão um drone capaz de resistir a rajadas de vento.

Cientistas da Universidade RMIT (Austrália) e da Universidade de Bristol (Reino Unido) propuseram um método…

40 minutos atrás

O retorno ao DDR4 está a todo vapor: a Intel retomou a produção dos processadores Raptor Lake.

A demanda por processadores está atualmente em seu nível mais alto, com o segmento de…

40 minutos atrás

Ativistas americanos de direitos humanos declararam que a rede social X representa uma séria ameaça à privacidade dos americanos.

Ativistas americanos de direitos humanos alertaram a Comissão Federal de Comércio (FTC) dos EUA sobre…

40 minutos atrás

A Relic anunciou o “emocionante” jogo de estratégia roguelike Company of Heroes 3: Final Stand – trailer, data de lançamento e detalhes da jogabilidade.

O estúdio independente canadense Relic Entertainment anunciou uma sequência para sua série de estratégia da…

2 horas atrás

Elon Musk admitiu que os volumes de produção do robô Tesla Optimus serão modestos inicialmente.

As vendas de veículos elétricos da Tesla estão em declínio inexorável, no mínimo, e é…

3 horas atrás