Google apresenta IA para robôs que podem trabalhar offline e amarrar cadarços

O Google DeepMind lançou uma nova versão do seu modelo de IA Gemini Robotics para robôs desconectados, o Gemini Robotics On-Device. Trata-se de um modelo de visão-linguagem-ação (VLA) com os mesmos recursos do modelo revelado em março, mas o Google afirma que é “pequeno e poderoso o suficiente para ser executado diretamente em um robô”.

Fonte da imagem: Google DeepMind

A robótica apresenta um desafio único para a IA, pois um robô não apenas existe no mundo físico, mas também modifica seu ambiente. Seja movendo blocos ou amarrando os cadarços, é difícil prever todas as situações possíveis que um robô pode encontrar. A abordagem tradicional para ensinar ações a um robô por meio de reforço era muito lenta, mas a IA generativa permite uma generalização muito maior.

O principal modelo de IA On-Device da Gemini Robotics ajuda robôs a realizar uma ampla gama de tarefas físicas sem qualquer treinamento prévio. Isso inclui generalizar para novos cenários, compreender e executar comandos de voz e realizar tarefas motoras finas.

Carolina Parada, líder de robótica do Google DeepMind, disse ao The Verge que o modelo original da Gemini Robotics utiliza uma abordagem híbrida que permite a execução tanto no dispositivo quanto na nuvem. O novo modelo, exclusivo para dispositivos, oferece grande parte da mesma funcionalidade sem conexão à internet.

Parada afirma que o Gemini Robotics On-Device é capaz de executar uma variedade de tarefas imediatamente, além de se adaptar a novos cenários em apenas 50 a 100 demonstrações no simulador de física MuJoCo.

Inicialmente, o modelo foi treinado apenas para os robôs ALOHA do Google, mas posteriormente foi adaptado para outros tipos, incluindo o robô humanoide Apollo da Apptronik e o Franka FR3 de dois braços. Segundo o Google, o Franka FR3 lidou com sucesso com novas tarefas e objetos com os quais não havia se deparado antes, como a montagem em uma esteira transportadora industrial.

«O modelo híbrido da Gemini Robotics ainda é mais potente, mas ficamos positivamente surpresos com a potência do modelo On-Device”, diz Parada. “Eu o consideraria um modelo básico ou uma solução para aplicativos que não têm uma conexão de internet estável.” Também pode ser útil para empresas com requisitos de segurança rigorosos.

O Google lançou o primeiro SDK Gemini Robotics para o modelo On-Device. O SDK permite que os desenvolvedores testem e ajustem o modelo. É a primeira ferramenta desse tipo lançada para os modelos VLA do Google DeepMind.

admin

Postagens recentes

Muitos fabricantes de componentes eletrônicos aumentarão os preços a partir de 1º de abril.

Memória, CPUs, dispositivos de armazenamento e chips gráficos não serão as únicas categorias de componentes…

38 minutos atrás

Pela primeira vez em um caso de vício em redes sociais, um tribunal dos EUA aplicou uma multa de US$ 6 milhões a um usuário.

Um júri de Los Angeles proferiu um veredicto no primeiro julgamento da história sobre vício…

2 horas atrás

A Sonova decidiu vender sua divisão de fones de ouvido para a Sennheiser.

A Sonova, fabricante suíça de aparelhos auditivos, decidiu vender sua divisão de aparelhos auditivos para…

2 horas atrás

A Meta está passando por uma nova onda de demissões, tudo em nome da inteligência artificial.

A Meta✴ iniciou mais uma onda de demissões em massa. Centenas de funcionários já foram…

2 horas atrás

O Google classificou o Android e o Chrome como as plataformas de navegação na web mais rápidas.

O Google anunciou que o Android e o Chrome, juntos, agora são as plataformas de…

2 horas atrás