Pesquisadores da Apple e da Universidade Estadual de Ohio criaram um novo modelo de difusão de correspondência de fluxo discreto em poucos passos (FS-DFM) que pode escrever texto 128 vezes mais rápido que seus concorrentes, informou o 9to5mac.com, citando o estudo “FS-DFM: geração rápida e precisa de texto longo com modelos de difusão de linguagem de correspondência de fluxo discreto em poucos passos”.

Fonte da imagem: Jackson Sophat/unsplash.com

De acordo com o estudo, o FS-DFM é capaz de transcrever fragmentos completos de texto em apenas oito etapas rápidas de refinamento. Outros modelos de difusão exigem mais de mil etapas para atingir o mesmo resultado.

Para isso, os pesquisadores utilizam uma abordagem de três etapas: primeiro, o modelo é treinado para lidar com diferentes tipos de iterações de refinamento. Em seguida, utilizam um modelo “professor” orientador, que o ajuda a fazer atualizações maiores e mais precisas a cada iteração, mantendo-se dentro do texto especificado. Por fim, ajustam o desempenho de cada iteração para que o resultado final seja alcançado em menos etapas, mantendo um modelo mais estável.

Comparado a modelos de difusão maiores, o FS-DFM apresentou bom desempenho em duas métricas importantes: perplexidade e entropia. A perplexidade reflete a qualidade do texto nos modelos de linguagem. Quanto menor, mais preciso e natural o texto soa. A entropia reflete a confiança com que o modelo seleciona cada palavra. Se a entropia for muito baixa, o texto pode se tornar repetitivo ou previsível, mas se for muito alta, pode parecer desconexo com palavras aleatórias.

Comparados aos modelos de difusão Dream com 7 bilhões de parâmetros e LLaDA com 8 bilhões de parâmetros, as variantes FS-DFM com 1,7 e 1,3 bilhão de parâmetros, bem como 0,17 bilhão de parâmetros, forneceram consistentemente menor perplexidade e entropia mais estável ao longo de todo o número de iterações.

Os desenvolvedores declararam que “planejam publicar o código do modelo e os pontos de verificação para facilitar a reprodutibilidade e desenvolvimentos futuros”.pesquisar.”

admin

Postagens recentes

A longa disputa entre a Apple e a Epic Games chegará à Suprema Corte dos EUA pela segunda vez.

A Apple está se preparando para recorrer novamente do processo judicial de longa data contra…

44 minutos atrás

A Broadcom expande o acordo de fornecimento de chips de IA do Google, e a Anthropic também se beneficiará.

A Broadcom está se consolidando cada vez mais como parceira no desenvolvimento de chips de…

1 hora atrás

Resultados de IA para março de 2026: Uma tarefa simples? / Inteligência Artificial

\nO eixo x representa os anos e o eixo y representa os trilhões de palavras…

6 horas atrás

Calendário de lançamentos de 6 a 12 de abril: Starfield: Terran Armada, DarkSwitch e People of Note.

A semana de 6 a 12 de abril foi bastante diversificada, com jogos que variaram…

7 horas atrás

“Com ares de Driver da era PS1”: O trailer de lançamento do jogo de ação e crime Samson: A Tyndalston Story, do criador de Just Cause, deixou os jogadores intrigados.

O estúdio sueco Liquid Swords, fundado por Christopher Sundberg, cofundador da Avalanche Studios e criador…

8 horas atrás

Na época do anúncio, State of Decay 3 existia apenas como um documento do Word — não haveria animais zumbis no jogo.

Em entrevista ao blogueiro Sunny Games, o CEO da Undead Labs, Philip Holt, explicou por…

9 horas atrás