Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A inteligência artificial tem demonstrado progresso na aprendizagem de línguas raras e pouco conhecidas.

Modelos de inteligência artificial em larga escala começaram a reduzir ativamente a lacuna linguística em todo o mundo, com os modelos mais avançados obtendo sucesso significativo no processamento de idiomas raros que representavam desafios para os sistemas anteriores. A informação foi divulgada pela TechRadar, citando uma pesquisa da RWS.

Fonte da imagem: bennett tobias / unsplash.com

O modelo Google Gemini Pro obteve altas pontuações de desempenho (acima de 4,5 de 5) por seu conhecimento de kinyarwanda, um idioma falado por 12 milhões de pessoas em Ruanda, Uganda e República Democrática do Congo. Os autores do estudo atribuíram essa melhoria ao fato de que a IA frequentemente explora padrões estatísticos comuns entre idiomas. Modelos avançados não exigem mais conjuntos de dados enormes para cada idioma; a limitação de dados de treinamento é compensada por mecanismos de transferência entre idiomas. Outro fator positivo são as melhorias no tokenizador, uma ferramenta que divide as palavras da consulta em fragmentos chamados tokens. Tudo isso ajuda os modelos de IA a terem um desempenho melhor com idiomas raros e pouco conhecidos.

Durante o estudo, os especialistas descobriram um efeito de “deriva de benchmark”, no qual o desempenho dos modelos muda inesperadamente entre versões. Por exemplo, a versão mais recente do OpenAI GPT fica atrás de versões anteriores em diversas tarefas de geração de conteúdo, mesmo que sua antecessora fosse mais eficiente nas mesmas tarefas. O desempenho do tokenizador também pode variar significativamente entre gerações de modelos — um é 3,5 vezes mais eficiente que o outro ao trabalhar com determinados idiomas. Portanto, ao escolher um modelo para implantação em aplicações multilíngues, não é recomendável confiar em resultados de benchmarks de sistemas anteriores.

Até recentemente, muitos laboratórios de IA priorizavam o desempenho em inglês e em vários outros idiomas importantes do mundo; os modelos modernos demonstraram melhorias significativas nessas áreas.Os desenvolvedores estão começando a priorizar o alcance de um público amplo, e especialistas esperam que muitos sigam o exemplo. No entanto, uma classificação de 4,5 de 5 não garante proficiência real no idioma, e o suporte multilíngue ainda não se tornou uma necessidade. Os desenvolvedores estão recorrendo a materiais em idiomas menos comuns, em parte porque os recursos em inglês estão se esgotando. Mesmo assim, a IA continua a derrubar as barreiras linguísticas.

admin

Próximo Os astrônomos aprenderam a reconstruir as "biografias" das galáxias a partir de uma única fotografia. »

Anterior « A Microsoft contornou as restrições do YouTube – o Edge para dispositivos móveis agora reproduz vídeos em segundo plano.

Deixar comentário

Publicado por

admin

3 meses atrás

Postagens recentes

Jogos

Release Calendar July 13-19: The Alters: Last Variable, Denshattack! e Moss: a relíquia esquecida

\nMeados de julho irá agradá-lo com vários lançamentos notáveis de uma só vez. A principal…

46 minutos atrás

Espaço

Detritos espaciais atingiram a órbita geossíncrona – e ameaçam satélites caros

Pequenos pedaços de detritos espaciais medindo apenas cerca de 5 centímetros de tamanho espalharam-se pela…

2 horas atrás

Monitores, projetores, sintonizadores de TV, televisões

A Acer lançou um monitor 3D sem óculos Predator XB273K 3D por US$ 1.100, mas até agora apenas na China

\nAcer lançou um monitor de jogos 3D Predator XB273K de 27 polegadas, anunciado um mês…

2 horas atrás

Desenvolvimento e fabricação de eletrônicos

A Intel investirá 5 bilhões de euros na maior fábrica de chips da Europa para produzir lá processadores Angstrom

\nA Intel está investindo € 5 bilhões para expandir sua unidade de produção em Leixlip,…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

As ações da Apple voltaram a crescer – os investidores apreciaram a cautela com os investimentos em IA

\nAs ações da Apple caíram significativamente após as apresentações na conferência WWDC 2026, o que…

3 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O Trojan RedHook começou a se espalhar pelos smartphones Android, drenando as contas bancárias das vítimas.

\nEspecialistas do Group-IB, empresa que atua na área de segurança da informação, relataram a identificação…

3 horas atrás