A série DeepMind Alpha de modelos de inteligência artificial foi a primeira do mundo em várias categorias – por exemplo, AlphaGo venceu o campeão mundial em Go pela primeira vez. Agora, esses modelos, originalmente treinados em jogos, estão sendo usados ​​para outras tarefas, para as quais mostraram habilidades inesperadas.

Fonte da imagem: deepmind.com

Inicialmente, o AlphaGo foi treinado em jogos jogados por pessoas. Seu sucessor, AlphaGo Zero, aprendeu jogando sozinho, e AlphaZero aprendeu xadrez e o jogo japonês de shogi da mesma forma. O MuZero aprendeu esses e outros jogos mesmo sem conhecer suas regras, que, aliás, limitam o jogador em como resolver o problema.

Nos datacenters (DPCs) de propriedade do Google, o sistema Borg é responsável pela distribuição das tarefas – analisa as solicitações e aloca instantaneamente os recursos necessários. Em seu funcionamento, o sistema é guiado por regras estabelecidas manualmente, que, a princípio, não podem levar em consideração todos os esquemas reais de distribuição de carga de trabalho, gerando inevitáveis ​​ineficiências, também difíceis de rastrear.

“Em algum momento, os dados de Borg alimentaram o modelo de AlphaZero, que começou a identificar padrões na distribuição de recursos do data center dependendo das tarefas recebidas, após o que desenvolveu novas maneiras de prever e gerenciar essa carga. Em condições reais de produção, isso ajudou reduzir a parcela de equipamentos subutilizados em 19%, o que é uma quantia significativa em termos do Google.”

As redes neurais MuZero atribuíram eficiência de compactação aos vídeos do YouTube, uma área que permite obter resultados notáveis ​​mesmo com um pouco de otimização. O modelo conseguiu reduzir a taxa de bits do vídeo em 4%, o que é bastante na escala do YouTube, e oferecer novas formas de agrupar quadros. Por fim, o modelo irmão do AlphaZero, AlphaDev, ajudou a melhorar os algoritmos de classificação em relação aos padrões da biblioteca do Google. Ele também otimizou a função de hash para pequenos intervalos de bytes (de 9 a 16), reduzindo a carga em 30%.

Em outras palavras, modelos de IA originalmente projetados para ganhar jogos conseguiram explorar áreas aparentemente estranhas e sugerir maneiras de otimizar tarefas de trabalho, ao mesmo tempo em que mostram certa flexibilidade. E no ano passado, o AlphaZero desenvolveu maneiras novas e mais eficientes de multiplicar algumas matrizes matemáticas pela primeira vez em meio século.

avalanche

Postagens recentes

O tokamak japonês JT-60SA bateu recorde de volume de plasma retido – 160 m³

O maior reator termonuclear do mundo, JT-60SA, criado como parte de um projeto conjunto entre…

24 minutos atrás

A União Europeia proibiu a Meta de usar indefinidamente os dados do usuário para publicidade direcionada

Parece que as redes sociais como o Facebook✴ terão de reconsiderar as suas políticas de…

1 hora atrás

Os autores da antologia “Secret Level” dedicada aos videogames mostraram uma introdução do UT99 no Unreal Engine 5

Na cerimônia de abertura da exposição temática Unreal Fest 2024, a Amazon Studios apresentou um…

1 hora atrás

Telegram anunciou um concurso para criar um análogo do YouTube para o messenger

É bem possível que o mensageiro Telegram, que atua simultaneamente como rede social, serviço de…

4 horas atrás

Fujitsu e Supermicro desenvolverão servidores Arm e sistemas de suporte de vida para data centers

A Fujitsu e a Supermicro anunciaram uma colaboração estratégica para desenvolver servidores de próxima geração…

5 horas atrás