Destreza robótica: o TopoOpt da Meta e do MIT ajudará a acelerar e reduzir o custo do treinamento de IA

As tecnologias de inteligência artificial (IA) estão se desenvolvendo rapidamente hoje e exigem um poder de computação cada vez mais sério. Mas junto com o crescimento dessas capacidades, os requisitos para o subsistema de rede também estão crescendo, então grandes empresas e organizações de pesquisa estão procurando novas maneiras de otimizar a infraestrutura.

A Meta*, em colaboração com o Instituto de Tecnologia de Massachusetts (MIT) e várias outras organizações de pesquisa, publicou dados de um experimento curioso no qual um cluster de IA pode alterar a topologia de sua interconexão usando um “braço robótico” mecânico.

O sistema foi nomeado TopoOpt porque os nós de computação nele usavam uma rede totalmente óptica com um patch panel óptico. Essa rede uniu 12 nós de computação ASUS ESC4000A-E10, cada um equipado com um acelerador NVIDIA A100, adaptadores de rede HPE e Mellanox ConnectX-5 (100 Gb / s) com transceptores ópticos.

Fonte aqui e abaixo: USENIX

O dispositivo mais interessante do experimento é o patch panel óptico Telescent, equipado com um manipulador mecânico capaz de religar em tempo real. Esse “braço robótico” era executado por um software especializado, cujo objetivo era encontrar a topologia de rede ideal e a segmentação de rede em relação a várias tarefas de aprendizado de máquina.

O sistema de rede óptica comutada não requer comutadores de alta velocidade que consomem energia e oferece várias outras vantagens

Esse patch panel robótico não é tão ágil quanto os interruptores ópticos de microespelho do Google, mas custa cinco vezes menos e tem mais portas. Os dados experimentais publicados indicam com segurança que a topologia de árvore gorda, que usa várias camadas de comutadores, não é ideal e até redundante para várias tarefas de rede neural.

Além disso, uma rede óptica reswitched sem comutadores tradicionais de alta velocidade requer menos equipamento, o que significa que pode não apenas ser mais rápida que uma rede de árvore gorda em várias tarefas de IA, mas também significativamente mais barata de implantar e manter em funcionamento – pelo menos devido à ausência de custos para alimentar vários switches.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal proferiu decisão final de liquidação ou proibição de atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

Honor, um robô humanoide, correu uma meia maratona mais rápido que um atleta profissional.

Na China, os robôs humanoides não estão apenas exibindo suas capacidades em apresentações festivas; sua…

2 horas atrás

A Samsung encerrou os pedidos de LPDDR4/4X e utilizará a capacidade liberada para produzir DRAM de 1 núcleo.

A Samsung Electronics anunciou oficialmente a suspensão da aceitação de novos pedidos de memória DRAM…

2 horas atrás

Após abandonar a produção de veículos elétricos, o projeto Afeela, da Sony e da Honda, continuará.

A Sony buscava há tempos aplicar sua expertise na produção de câmeras e sensores de…

3 horas atrás

O preço das ações da Intel está apenas 8% abaixo de sua máxima histórica de 2000.

Durante o pregão de sexta-feira, as ações da Intel subiram apenas 1,5%, para US$ 69,55,…

3 horas atrás

Sansão — “Problemas” Não em Nossa Casa. Resenha

Intel Core i5-10505 3.2 GHz / AMD Ryzen 5 3600 3.6 GHz, 16 GB de…

10 horas atrás