Destreza robótica: o TopoOpt da Meta e do MIT ajudará a acelerar e reduzir o custo do treinamento de IA

As tecnologias de inteligência artificial (IA) estão se desenvolvendo rapidamente hoje e exigem um poder de computação cada vez mais sério. Mas junto com o crescimento dessas capacidades, os requisitos para o subsistema de rede também estão crescendo, então grandes empresas e organizações de pesquisa estão procurando novas maneiras de otimizar a infraestrutura.

A Meta*, em colaboração com o Instituto de Tecnologia de Massachusetts (MIT) e várias outras organizações de pesquisa, publicou dados de um experimento curioso no qual um cluster de IA pode alterar a topologia de sua interconexão usando um “braço robótico” mecânico.

O sistema foi nomeado TopoOpt porque os nós de computação nele usavam uma rede totalmente óptica com um patch panel óptico. Essa rede uniu 12 nós de computação ASUS ESC4000A-E10, cada um equipado com um acelerador NVIDIA A100, adaptadores de rede HPE e Mellanox ConnectX-5 (100 Gb / s) com transceptores ópticos.

Fonte aqui e abaixo: USENIX

O dispositivo mais interessante do experimento é o patch panel óptico Telescent, equipado com um manipulador mecânico capaz de religar em tempo real. Esse “braço robótico” era executado por um software especializado, cujo objetivo era encontrar a topologia de rede ideal e a segmentação de rede em relação a várias tarefas de aprendizado de máquina.

O sistema de rede óptica comutada não requer comutadores de alta velocidade que consomem energia e oferece várias outras vantagens

Esse patch panel robótico não é tão ágil quanto os interruptores ópticos de microespelho do Google, mas custa cinco vezes menos e tem mais portas. Os dados experimentais publicados indicam com segurança que a topologia de árvore gorda, que usa várias camadas de comutadores, não é ideal e até redundante para várias tarefas de rede neural.

Além disso, uma rede óptica reswitched sem comutadores tradicionais de alta velocidade requer menos equipamento, o que significa que pode não apenas ser mais rápida que uma rede de árvore gorda em várias tarefas de IA, mas também significativamente mais barata de implantar e manter em funcionamento – pelo menos devido à ausência de custos para alimentar vários switches.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal proferiu decisão final de liquidação ou proibição de atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

Hubble e Webb juntos forneceram a melhor imagem de Saturno já registrada.

A Agência Espacial Europeia (ESA) divulgou o levantamento conjunto mais abrangente de Saturno, realizado por…

20 minutos atrás

A HP apresentou a estação de trabalho Z8 Fury G6i com suporte para quatro aceleradores NVIDIA RTX Pro 6000 Blackwell Max-Q Workstation Edition.

A HP anunciou a estação de trabalho desktop Z8 Fury G6i, projetada para tarefas complexas…

1 hora atrás

O computador empresarial Dell Pro 5 Micro, em um gabinete de um litro, recebeu um chip Intel Panther Lake com desempenho de IA de 50 TOPS.

A Dell Technologies apresentou o Pro 5 Micro, um computador de formato compacto projetado para…

1 hora atrás

O jogo multiplayer de detetive social 4 Penny Coffins leva os jogadores à Londres vitoriana em busca de Jack, o Estripador.

Os desenvolvedores do estúdio canadense Other Ocean Interactive (Project Winter) apresentaram o jogo multiplayer de…

1 hora atrás

A MTS Exolve apresenta um serviço para trabalho centralizado com chats de clientes.

A MTS Exolve, subsidiária integral da MTS, anunciou o lançamento de uma solução omnichannel para…

1 hora atrás