Destreza robótica: o TopoOpt da Meta e do MIT ajudará a acelerar e reduzir o custo do treinamento de IA

As tecnologias de inteligência artificial (IA) estão se desenvolvendo rapidamente hoje e exigem um poder de computação cada vez mais sério. Mas junto com o crescimento dessas capacidades, os requisitos para o subsistema de rede também estão crescendo, então grandes empresas e organizações de pesquisa estão procurando novas maneiras de otimizar a infraestrutura.

A Meta*, em colaboração com o Instituto de Tecnologia de Massachusetts (MIT) e várias outras organizações de pesquisa, publicou dados de um experimento curioso no qual um cluster de IA pode alterar a topologia de sua interconexão usando um “braço robótico” mecânico.

O sistema foi nomeado TopoOpt porque os nós de computação nele usavam uma rede totalmente óptica com um patch panel óptico. Essa rede uniu 12 nós de computação ASUS ESC4000A-E10, cada um equipado com um acelerador NVIDIA A100, adaptadores de rede HPE e Mellanox ConnectX-5 (100 Gb / s) com transceptores ópticos.

Fonte aqui e abaixo: USENIX

O dispositivo mais interessante do experimento é o patch panel óptico Telescent, equipado com um manipulador mecânico capaz de religar em tempo real. Esse “braço robótico” era executado por um software especializado, cujo objetivo era encontrar a topologia de rede ideal e a segmentação de rede em relação a várias tarefas de aprendizado de máquina.

O sistema de rede óptica comutada não requer comutadores de alta velocidade que consomem energia e oferece várias outras vantagens

Esse patch panel robótico não é tão ágil quanto os interruptores ópticos de microespelho do Google, mas custa cinco vezes menos e tem mais portas. Os dados experimentais publicados indicam com segurança que a topologia de árvore gorda, que usa várias camadas de comutadores, não é ideal e até redundante para várias tarefas de rede neural.

Além disso, uma rede óptica reswitched sem comutadores tradicionais de alta velocidade requer menos equipamento, o que significa que pode não apenas ser mais rápida que uma rede de árvore gorda em várias tarefas de IA, mas também significativamente mais barata de implantar e manter em funcionamento – pelo menos devido à ausência de custos para alimentar vários switches.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal proferiu decisão final de liquidação ou proibição de atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

As autoridades americanas estão se preparando para aumentar as tarifas de importação de chips, mas os clientes de hiperescala da TSMC receberão benefícios.

O governo do atual presidente dos EUA, Donald Trump, continua a reformar o comércio exterior…

2 horas atrás

O ex-produtor de GTA, Leslie Benzies, “deixou temporariamente a Build a Rocket Boy”, o estúdio que fundou, enquanto a direção da MindsEye espera seguir os passos de Cyberpunk 2077.

O ex-presidente da Rockstar North e ex-produtor de GTA, Leslie Benzies, deixou, pelo menos temporariamente,…

8 horas atrás

Calendário de lançamentos de 9 a 15 de fevereiro: Reanimal, Mewgenics, Romeo is a Dead Man e Disciples: Domination.

Meados de fevereiro traz uma semana agitada com grandes lançamentos e projetos indie empolgantes. Os…

9 horas atrás

O espetacular filme de ação retrofuturista Replaced encantou os jornalistas e em breve receberá uma demo no Steam.

Replaced, um jogo de plataforma de ação retrofuturista da Sad Cat Studios, uma equipe polonesa…

10 horas atrás

O Snapdragon X2 Elite foi mais rápido que o Apple M5 em testes sintéticos, mas perdeu para o Ryzen AI 9 e o Core Ultra X9 em jogos.

Espera-se que os laptops baseados nos processadores Snapdragon X2 de segunda geração da Qualcomm, com…

10 horas atrás