Destreza robótica: o TopoOpt da Meta e do MIT ajudará a acelerar e reduzir o custo do treinamento de IA

As tecnologias de inteligência artificial (IA) estão se desenvolvendo rapidamente hoje e exigem um poder de computação cada vez mais sério. Mas junto com o crescimento dessas capacidades, os requisitos para o subsistema de rede também estão crescendo, então grandes empresas e organizações de pesquisa estão procurando novas maneiras de otimizar a infraestrutura.

A Meta*, em colaboração com o Instituto de Tecnologia de Massachusetts (MIT) e várias outras organizações de pesquisa, publicou dados de um experimento curioso no qual um cluster de IA pode alterar a topologia de sua interconexão usando um “braço robótico” mecânico.

O sistema foi nomeado TopoOpt porque os nós de computação nele usavam uma rede totalmente óptica com um patch panel óptico. Essa rede uniu 12 nós de computação ASUS ESC4000A-E10, cada um equipado com um acelerador NVIDIA A100, adaptadores de rede HPE e Mellanox ConnectX-5 (100 Gb / s) com transceptores ópticos.

Fonte aqui e abaixo: USENIX

O dispositivo mais interessante do experimento é o patch panel óptico Telescent, equipado com um manipulador mecânico capaz de religar em tempo real. Esse “braço robótico” era executado por um software especializado, cujo objetivo era encontrar a topologia de rede ideal e a segmentação de rede em relação a várias tarefas de aprendizado de máquina.

O sistema de rede óptica comutada não requer comutadores de alta velocidade que consomem energia e oferece várias outras vantagens

Esse patch panel robótico não é tão ágil quanto os interruptores ópticos de microespelho do Google, mas custa cinco vezes menos e tem mais portas. Os dados experimentais publicados indicam com segurança que a topologia de árvore gorda, que usa várias camadas de comutadores, não é ideal e até redundante para várias tarefas de rede neural.

Além disso, uma rede óptica reswitched sem comutadores tradicionais de alta velocidade requer menos equipamento, o que significa que pode não apenas ser mais rápida que uma rede de árvore gorda em várias tarefas de IA, mas também significativamente mais barata de implantar e manter em funcionamento – pelo menos devido à ausência de custos para alimentar vários switches.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal proferiu decisão final de liquidação ou proibição de atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

A alta demanda da Tesla por robotáxis revelou-se uma farsa – apenas dez veículos estão em operação simultaneamente.

Em junho deste ano, a Tesla lançou seu serviço de robotáxis na capital do Texas,…

16 minutos atrás

Cerca de 80% de todos os centros de dados do mundo são construídos em condições climáticas longe do ideal.

De acordo com um estudo da Rest of World, quase 7.000 dos 8.808 data centers…

48 minutos atrás

A Samsung está preparando o Wide Fold, um smartphone dobrável com proporção de tela 4:3, semelhante ao da Apple.

A Samsung Electronics está tentando acompanhar seus concorrentes no segmento de smartphones dobráveis. O Galaxy…

3 horas atrás