Destreza robótica: o TopoOpt da Meta e do MIT ajudará a acelerar e reduzir o custo do treinamento de IA

As tecnologias de inteligência artificial (IA) estão se desenvolvendo rapidamente hoje e exigem um poder de computação cada vez mais sério. Mas junto com o crescimento dessas capacidades, os requisitos para o subsistema de rede também estão crescendo, então grandes empresas e organizações de pesquisa estão procurando novas maneiras de otimizar a infraestrutura.

A Meta*, em colaboração com o Instituto de Tecnologia de Massachusetts (MIT) e várias outras organizações de pesquisa, publicou dados de um experimento curioso no qual um cluster de IA pode alterar a topologia de sua interconexão usando um “braço robótico” mecânico.

O sistema foi nomeado TopoOpt porque os nós de computação nele usavam uma rede totalmente óptica com um patch panel óptico. Essa rede uniu 12 nós de computação ASUS ESC4000A-E10, cada um equipado com um acelerador NVIDIA A100, adaptadores de rede HPE e Mellanox ConnectX-5 (100 Gb / s) com transceptores ópticos.

Fonte aqui e abaixo: USENIX

O dispositivo mais interessante do experimento é o patch panel óptico Telescent, equipado com um manipulador mecânico capaz de religar em tempo real. Esse “braço robótico” era executado por um software especializado, cujo objetivo era encontrar a topologia de rede ideal e a segmentação de rede em relação a várias tarefas de aprendizado de máquina.

O sistema de rede óptica comutada não requer comutadores de alta velocidade que consomem energia e oferece várias outras vantagens

Esse patch panel robótico não é tão ágil quanto os interruptores ópticos de microespelho do Google, mas custa cinco vezes menos e tem mais portas. Os dados experimentais publicados indicam com segurança que a topologia de árvore gorda, que usa várias camadas de comutadores, não é ideal e até redundante para várias tarefas de rede neural.

Além disso, uma rede óptica reswitched sem comutadores tradicionais de alta velocidade requer menos equipamento, o que significa que pode não apenas ser mais rápida que uma rede de árvore gorda em várias tarefas de IA, mas também significativamente mais barata de implantar e manter em funcionamento – pelo menos devido à ausência de custos para alimentar vários switches.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal proferiu decisão final de liquidação ou proibição de atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Postagens recentes

A Cloudflare acusou o Google de pressionar editores da web a coletar dados para treinamento de IA.

O CEO da Cloudflare, Matthew Prince, afirmou que o Google está usando sua posição dominante…

2 horas atrás

Uma câmera com abertura variável poderá aparecer na linha Galaxy como resposta ao iPhone 18.

A Samsung está considerando trazer de volta a câmera com abertura variável para seus smartphones…

2 horas atrás

A Ferrari revelou o interior do seu carro elétrico Luce, desenvolvido em colaboração com o estúdio LoveFrom de Jony Ive.

A Ferrari divulgou as primeiras imagens do interior do seu carro elétrico Luce, desenvolvido em…

2 horas atrás

O Ministério do Desenvolvimento Digital propôs substituir o bloqueio total de chamadas internacionais por um regime de “autobloqueio”.

O Ministério do Desenvolvimento Digital, Comunicações e Mídia de Massa anunciou sua intenção de alterar…

2 horas atrás

As autoridades americanas estão se preparando para aumentar as tarifas de importação de chips, mas os clientes de hiperescala da TSMC receberão benefícios.

O governo do atual presidente dos EUA, Donald Trump, continua a reformar o comércio exterior…

5 horas atrás