O Toyota Research Institute (TRI) usou inteligência artificial generativa para ensinar aos robôs algumas habilidades para preparar o café da manhã. E não exigiu centenas de horas de programação e trabalho adicional em bugs e correções. Em vez disso, os pesquisadores equiparam os robôs com sensores especiais que fornecem uma sensação de tato, conectaram-nos a um modelo de inteligência artificial e depois mostraram ao sistema o que fazer, escreve The Verge.

Fonte da imagem: Instituto de Pesquisa Toyota

Os pesquisadores observaram que o sentido do tato é “um dos fatores-chave” na aprendizagem. Graças ao toque, o robô consegue “sentir” o que está fazendo, obtendo mais informações. Isso torna tarefas complexas mais fáceis do que usar apenas câmeras.

De acordo com o pesquisador do laboratório TRI, Ben Burchfiel, “é interessante ver como eles (robôs) interagem com o meio ambiente”. Primeiro, um “professor” demonstra um conjunto de habilidades e depois, “durante várias horas”, o modelo aprende em segundo plano. “Normalmente treinamos o robô durante o dia, deixamos que ele aprenda a noite toda e então iniciamos o novo comportamento de trabalho na manhã seguinte”, explicou Burchfield.

Os pesquisadores disseram que estão tentando criar o que chamam de Grandes Modelos de Comportamento (LBM). Assim como os grandes modelos de linguagem (LLMs) aprendem observando padrões no texto, os modelos LBM da Toyota aprendem através da observação e depois “generalizam aplicando uma nova habilidade que nunca foram ensinadas”, diz Russ Tedrake, professor de robótica do Massachusetts Institute of Technology e vice-presidente de pesquisa em robótica do TRI. Usando esse método, os pesquisadores ensinaram aos robôs mais de 60 habilidades complexas, como “derramar líquidos, usar ferramentas e manipular objetos deformáveis”. Os pesquisadores do TRI planejam treinar robôs em até 1.000 habilidades até o final de 2024.

O Google está trabalhando em uma direção semelhante, criando o modelo de IA RT-2 (Robotics Transformer 2) da classe Vision-Language-Action (VLA). Semelhante ao design da Toyota, os robôs baseados no RT-2 usam sua experiência para tomar decisões sobre como agir. Teoricamente, os robôs treinados pela inteligência artificial poderiam eventualmente executar tarefas com pouca ou nenhuma instrução além das instruções gerais que normalmente seriam dadas a um ser humano, como “limpar uma mancha no chão”.

Como observou o The New York Times, esse tipo de trabalho (criar um modelo como RT) é geralmente “lento e trabalhoso”, e fornecer dados de treinamento suficientes é muito mais difícil do que simplesmente alimentar um modelo de IA com uma massa de dados que pode ser baixado da Internet.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *