A equipe de robótica DeepMind do Google revelou três novos produtos que ajudarão os robôs a tomar decisões mais rápidas e a realizar tarefas com mais eficiência e segurança quando cercados por pessoas.

Fonte da imagem: deepmind.google

O sistema de aquisição de dados do AutoRT usa um modelo de linguagem visual (VLM) e um modelo de linguagem grande (LLM) para ajudar os robôs a avaliar seu ambiente, adaptar-se a ambientes desconhecidos e tomar decisões de tarefas. O VLM é usado para analisar o ambiente e reconhecer objetos à vista; e o LLM é responsável pela execução criativa das tarefas. A inovação mais importante do AutoRT foi o aparecimento no bloco LLM da “Constituição do Robô” – comandos voltados para a segurança que instruem a máquina a evitar a escolha de tarefas que envolvam pessoas, animais, objetos pontiagudos e até aparelhos elétricos. Para maior segurança, os robôs são programados para parar quando a força conjunta excede um determinado limite; e seu design agora possui um interruptor físico adicional que uma pessoa pode usar em caso de emergência.

Nos últimos sete meses, o Google implantou 53 robôs AutoRT em quatro de seus edifícios de escritórios e realizou mais de 77 mil testes. Algumas das máquinas eram controladas remotamente por operadores, enquanto outras executavam tarefas de forma autônoma, seja com base em um determinado algoritmo ou usando o modelo de IA do Robotic Transformer (RT-2). Até agora, todos esses robôs parecem extremamente simples: são membros manipuladores sobre uma base móvel e câmeras para avaliar a situação.

A segunda inovação foi o sistema SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers), que visa otimizar o funcionamento do modelo RT-2. Os pesquisadores descobriram que quando os dados de entrada eram duplicados, por exemplo, aumentando a resolução das câmeras, a necessidade de recursos computacionais do robô quadruplicava. Este problema foi resolvido graças a um novo método de ajuste fino da IA, denominado up-training – este método torna o aumento quadrático na necessidade de recursos computacionais quase linear. Devido a isso, o modelo funciona mais rápido mantendo a mesma qualidade.

Por fim, os engenheiros do Google DeepMind desenvolveram um modelo de IA chamado RT-Trajectory, que facilita o treinamento de robôs para realizar tarefas específicas. Definida a tarefa, o próprio operador demonstra um exemplo de sua implementação; O RT-Trajectory analisa a trajetória especificada por uma pessoa e a adapta às ações do robô.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *