A série DeepMind Alpha de modelos de inteligência artificial foi a primeira do mundo em várias categorias – por exemplo, AlphaGo venceu o campeão mundial em Go pela primeira vez. Agora, esses modelos, originalmente treinados em jogos, estão sendo usados ​​para outras tarefas, para as quais mostraram habilidades inesperadas.

Fonte da imagem: deepmind.com

Inicialmente, o AlphaGo foi treinado em jogos jogados por pessoas. Seu sucessor, AlphaGo Zero, aprendeu jogando sozinho, e AlphaZero aprendeu xadrez e o jogo japonês de shogi da mesma forma. O MuZero aprendeu esses e outros jogos mesmo sem conhecer suas regras, que, aliás, limitam o jogador em como resolver o problema.

Nos datacenters (DPCs) de propriedade do Google, o sistema Borg é responsável pela distribuição das tarefas – analisa as solicitações e aloca instantaneamente os recursos necessários. Em seu funcionamento, o sistema é guiado por regras estabelecidas manualmente, que, a princípio, não podem levar em consideração todos os esquemas reais de distribuição de carga de trabalho, gerando inevitáveis ​​ineficiências, também difíceis de rastrear.

“Em algum momento, os dados de Borg alimentaram o modelo de AlphaZero, que começou a identificar padrões na distribuição de recursos do data center dependendo das tarefas recebidas, após o que desenvolveu novas maneiras de prever e gerenciar essa carga. Em condições reais de produção, isso ajudou reduzir a parcela de equipamentos subutilizados em 19%, o que é uma quantia significativa em termos do Google.”

As redes neurais MuZero atribuíram eficiência de compactação aos vídeos do YouTube, uma área que permite obter resultados notáveis ​​mesmo com um pouco de otimização. O modelo conseguiu reduzir a taxa de bits do vídeo em 4%, o que é bastante na escala do YouTube, e oferecer novas formas de agrupar quadros. Por fim, o modelo irmão do AlphaZero, AlphaDev, ajudou a melhorar os algoritmos de classificação em relação aos padrões da biblioteca do Google. Ele também otimizou a função de hash para pequenos intervalos de bytes (de 9 a 16), reduzindo a carga em 30%.

Em outras palavras, modelos de IA originalmente projetados para ganhar jogos conseguiram explorar áreas aparentemente estranhas e sugerir maneiras de otimizar tarefas de trabalho, ao mesmo tempo em que mostram certa flexibilidade. E no ano passado, o AlphaZero desenvolveu maneiras novas e mais eficientes de multiplicar algumas matrizes matemáticas pela primeira vez em meio século.

avalanche

Postagens recentes

Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Segundo o Phoronix, a versão mais recente do driver gráfico Gallium3D R600, incluída no Mesa…

22 minutos atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

48 minutos atrás

A Anthropic revelou Claude Fable 5, uma “versão segura” do tão comentado Mythos.

No início deste mês, a Anthropic expandiu a disponibilidade de seu modelo de IA mais…

1 hora atrás

A Meta utilizará a atividade do usuário em outros sites para personalizar seus feeds e respostas de IA.

A Meta✴ planeja usar dados de comportamento do usuário obtidos de outras empresas para personalizar…

2 horas atrás

“Eles poderiam ter resolvido tudo com um e-mail”: O novo trailer de The Duskbloods, um filme de ação dos criadores de Bloodborne e Elden Ring, decepcionou os fãs.

Como esperado, a apresentação Nintendo Direct de junho incluiu novidades sobre o jogo de ação…

2 horas atrás