Destreza robótica: o TopoOpt da Meta e do MIT ajudará a acelerar e reduzir o custo do treinamento de IA

As tecnologias de inteligência artificial (IA) estão se desenvolvendo rapidamente hoje e exigem um poder de computação cada vez mais sério. Mas junto com o crescimento dessas capacidades, os requisitos para o subsistema de rede também estão crescendo, então grandes empresas e organizações de pesquisa estão procurando novas maneiras de otimizar a infraestrutura.

A Meta*, em colaboração com o Instituto de Tecnologia de Massachusetts (MIT) e várias outras organizações de pesquisa, publicou dados de um experimento curioso no qual um cluster de IA pode alterar a topologia de sua interconexão usando um “braço robótico” mecânico.

O sistema foi nomeado TopoOpt porque os nós de computação nele usavam uma rede totalmente óptica com um patch panel óptico. Essa rede uniu 12 nós de computação ASUS ESC4000A-E10, cada um equipado com um acelerador NVIDIA A100, adaptadores de rede HPE e Mellanox ConnectX-5 (100 Gb / s) com transceptores ópticos.

Fonte aqui e abaixo: USENIX

O dispositivo mais interessante do experimento é o patch panel óptico Telescent, equipado com um manipulador mecânico capaz de religar em tempo real. Esse “braço robótico” era executado por um software especializado, cujo objetivo era encontrar a topologia de rede ideal e a segmentação de rede em relação a várias tarefas de aprendizado de máquina.

O sistema de rede óptica comutada não requer comutadores de alta velocidade que consomem energia e oferece várias outras vantagens

Esse patch panel robótico não é tão ágil quanto os interruptores ópticos de microespelho do Google, mas custa cinco vezes menos e tem mais portas. Os dados experimentais publicados indicam com segurança que a topologia de árvore gorda, que usa várias camadas de comutadores, não é ideal e até redundante para várias tarefas de rede neural.

Além disso, uma rede óptica reswitched sem comutadores tradicionais de alta velocidade requer menos equipamento, o que significa que pode não apenas ser mais rápida que uma rede de árvore gorda em várias tarefas de IA, mas também significativamente mais barata de implantar e manter em funcionamento – pelo menos devido à ausência de custos para alimentar vários switches.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal proferiu decisão final de liquidação ou proibição de atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

GMC amplia gama de picapes elétricas Hummer com versões de 571 km de alcance

Após o lançamento bem-sucedido do GMC Hummer EV, a empresa anunciou novas picapes elétricas e…

45 minutos atrás

A União Europeia colocará data centers em eco-registro e os obrigará fornecer calor residual para as necessidades da sociedade

O Parlamento Europeu e o Conselho Europeu finalmente concordaram com o texto da Diretiva de…

46 minutos atrás

Mais quatro jogos da Ubisoft chegando ao Steam antes do final de junho, incluindo Far Cry 6 e Rainbow Six Extraction

A Ubisoft continua seu retorno gradual ao Steam. Como observou o usuário Chairmanchuck do fórum…

1 hora atrás

Rumores: os planos da Blizzard para sexta série em Diablo IV revelaram uma caneca de cerveja com símbolos do jogo

O próximo RPG de fantasia da Blizzard Entertainment, Diablo IV, anunciou cinco classes de personagens…

1 hora atrás

WhatsApp poderá salvar mensagens “desaparecidas”, mas apenas com o consentimento do remetente

As mensagens do WhatsApp que desaparecem e pressionadas por muito tempo permitirão que o usuário…

3 horas atrás