A Toyota ensinou robôs a preparar o café da manhã simplesmente mostrando como fazê-lo

O Toyota Research Institute (TRI) usou inteligência artificial generativa para ensinar aos robôs algumas habilidades para preparar o café da manhã. E não exigiu centenas de horas de programação e trabalho adicional em bugs e correções. Em vez disso, os pesquisadores equiparam os robôs com sensores especiais que fornecem uma sensação de tato, conectaram-nos a um modelo de inteligência artificial e depois mostraram ao sistema o que fazer, escreve The Verge.

Fonte da imagem: Instituto de Pesquisa Toyota

Os pesquisadores observaram que o sentido do tato é “um dos fatores-chave” na aprendizagem. Graças ao toque, o robô consegue “sentir” o que está fazendo, obtendo mais informações. Isso torna tarefas complexas mais fáceis do que usar apenas câmeras.

De acordo com o pesquisador do laboratório TRI, Ben Burchfiel, “é interessante ver como eles (robôs) interagem com o meio ambiente”. Primeiro, um “professor” demonstra um conjunto de habilidades e depois, “durante várias horas”, o modelo aprende em segundo plano. “Normalmente treinamos o robô durante o dia, deixamos que ele aprenda a noite toda e então iniciamos o novo comportamento de trabalho na manhã seguinte”, explicou Burchfield.

Os pesquisadores disseram que estão tentando criar o que chamam de Grandes Modelos de Comportamento (LBM). Assim como os grandes modelos de linguagem (LLMs) aprendem observando padrões no texto, os modelos LBM da Toyota aprendem através da observação e depois “generalizam aplicando uma nova habilidade que nunca foram ensinadas”, diz Russ Tedrake, professor de robótica do Massachusetts Institute of Technology e vice-presidente de pesquisa em robótica do TRI. Usando esse método, os pesquisadores ensinaram aos robôs mais de 60 habilidades complexas, como “derramar líquidos, usar ferramentas e manipular objetos deformáveis”. Os pesquisadores do TRI planejam treinar robôs em até 1.000 habilidades até o final de 2024.

O Google está trabalhando em uma direção semelhante, criando o modelo de IA RT-2 (Robotics Transformer 2) da classe Vision-Language-Action (VLA). Semelhante ao design da Toyota, os robôs baseados no RT-2 usam sua experiência para tomar decisões sobre como agir. Teoricamente, os robôs treinados pela inteligência artificial poderiam eventualmente executar tarefas com pouca ou nenhuma instrução além das instruções gerais que normalmente seriam dadas a um ser humano, como “limpar uma mancha no chão”.

Como observou o The New York Times, esse tipo de trabalho (criar um modelo como RT) é geralmente “lento e trabalhoso”, e fornecer dados de treinamento suficientes é muito mais difícil do que simplesmente alimentar um modelo de IA com uma massa de dados que pode ser baixado da Internet.

avalanche

Postagens recentes

As remessas globais de chips ultrapassaram US$ 400 bilhões este ano, e a expectativa é de que esse número aumente ainda mais no próximo ano.

A Nvidia é amplamente considerada um exemplo brilhante de como lucrar com o boom da…

20 minutos atrás

A situação já era boa: a Tesla começou a preparar os investidores para mais um colapso nas vendas de carros elétricos.

No ano passado, pela primeira vez em sua história, a Tesla encerrou o ano com…

20 minutos atrás

O primeiro sistema de armazenamento de energia renovável por ar liquefeito do mundo foi lançado na China.

A energia renovável aborda questões ambientais, mas também apresenta desafios técnicos. O principal deles é…

30 minutos atrás

Seguindo os passos da Samsung: a LG apresentará as TVs LG Gallery na CES 2026.

A LG anunciou planos para lançar uma nova categoria de televisores, a LG Gallery TV,…

1 hora atrás