A startup Agility Robotics, com sede em Oregon, demonstrou a capacidade de seu robô Digit de perceber comandos de voz humana dados em linguagem natural sem instruções específicas.
O robô recebeu novos recursos ao conectar um grande modelo de linguagem a ele. “Estávamos curiosos para ver o que poderia ser alcançado integrando esta tecnologia ao Digit. O host físico de IA recriou o espaço de demonstração com um conjunto de estandes numerados de diferentes alturas e três caixas com algumas propriedades definidoras. A Digit tinha informações sobre esse ambiente, mas não recebeu dados específicos sobre suas tarefas – apenas comandos emitidos em linguagem natural de complexidade variada para ver se conseguia concluí-las”, disse Agility.
No experimento mostrado no vídeo, o robô foi instruído a pegar uma caixa da cor do “sabre de luz de Darth Vader” e colocá-la no suporte mais alto. Digit não executou o comando instantaneamente – ele agiu lentamente e a IA no chat comentou cada uma de suas ações, e este é um resultado impressionante para um projeto experimental. “Nosso departamento de inovação desenvolveu esta demonstração interativa para mostrar como um modelo de linguagem maior pode tornar os robôs mais versáteis e de implantação mais rápida. Na demonstração, as pessoas falaram com Digit em linguagem natural, pedindo-lhes que concluíssem tarefas e dando-lhes uma visão do futuro”, explicou Agility.
Será possível não apenas programar robôs promissores, mas também dar-lhes comandos em linguagem humana simples. E as máquinas, aparentemente, terão de aprender a ouvir os humanos.