Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

A Apple criou uma IA que gera textos 128 vezes mais rápido que seus equivalentes.

Pesquisadores da Apple e da Universidade Estadual de Ohio criaram um novo modelo de difusão de correspondência de fluxo discreto em poucos passos (FS-DFM) que pode escrever texto 128 vezes mais rápido que seus concorrentes, informou o 9to5mac.com, citando o estudo “FS-DFM: geração rápida e precisa de texto longo com modelos de difusão de linguagem de correspondência de fluxo discreto em poucos passos”.

Fonte da imagem: Jackson Sophat/unsplash.com

De acordo com o estudo, o FS-DFM é capaz de transcrever fragmentos completos de texto em apenas oito etapas rápidas de refinamento. Outros modelos de difusão exigem mais de mil etapas para atingir o mesmo resultado.

Para isso, os pesquisadores utilizam uma abordagem de três etapas: primeiro, o modelo é treinado para lidar com diferentes tipos de iterações de refinamento. Em seguida, utilizam um modelo “professor” orientador, que o ajuda a fazer atualizações maiores e mais precisas a cada iteração, mantendo-se dentro do texto especificado. Por fim, ajustam o desempenho de cada iteração para que o resultado final seja alcançado em menos etapas, mantendo um modelo mais estável.

Comparado a modelos de difusão maiores, o FS-DFM apresentou bom desempenho em duas métricas importantes: perplexidade e entropia. A perplexidade reflete a qualidade do texto nos modelos de linguagem. Quanto menor, mais preciso e natural o texto soa. A entropia reflete a confiança com que o modelo seleciona cada palavra. Se a entropia for muito baixa, o texto pode se tornar repetitivo ou previsível, mas se for muito alta, pode parecer desconexo com palavras aleatórias.

Comparados aos modelos de difusão Dream com 7 bilhões de parâmetros e LLaDA com 8 bilhões de parâmetros, as variantes FS-DFM com 1,7 e 1,3 bilhão de parâmetros, bem como 0,17 bilhão de parâmetros, forneceram consistentemente menor perplexidade e entropia mais estável ao longo de todo o número de iterações.

Os desenvolvedores declararam que “planejam publicar o código do modelo e os pontos de verificação para facilitar a reprodutibilidade e desenvolvimentos futuros”.pesquisar.”

admin

Próximo Protótipos do carro-chefe Xiaomi YU9 SUV foram vistos sendo testados em terrenos de alta altitude. »

Anterior « Intel e AMD comemoram um ano de colaboração — AVX10 e novas tecnologias estão a caminho

Deixar comentário

Publicado por

admin

8 meses atrás

Postagens recentes

Jogos

Gothic Remake – um espírito antigo em um novo corpo. Análise / Jogos

PC Gamer O tempo voa. Parece que foi ontem que estávamos relembrando Gothic e seus…

34 minutos atrás

Mercado de TI

Remake gótico – um espírito antigo em um novo corpo. Crítica

IgralinaPC O tempo voa. Parece que foi ontem que estávamos relembrando Gothic e seus criadores…

34 minutos atrás

Placas de vídeo

A placa de vídeo Radeon RX 9070 XT finalmente entrou para as estatísticas do Steam, mais de um ano após seu lançamento.

A AMD Radeon RX 9070 XT estreou entre as placas de vídeo mais populares do…

59 minutos atrás

Jogos

Prazos irreais, má gestão e medo de cancelamento: jornalistas revelam os problemas por trás do desenvolvimento do novo jogo Ghost Recon.

A direção da Ubisoft tem grandes expectativas para o próximo jogo principal da série de…

4 horas atrás

Jogos

Crimson Desert continua a evoluir para um simulador de criação de gado – detalhes da atualização 1.11.00

As atualizações pós-lançamento transformaram gradualmente o jogo de ação e aventura de mundo aberto e…

6 horas atrás

Notícias da rede

O Facebook e o Instagram sofreram uma grande interrupção – os feeds não estão atualizando, vídeos e imagens não estão carregando.

Segundo fontes online, uma grande interrupção está afetando as plataformas de mídia social Facebook✴ e…