A Toyota ensinou robôs a preparar o café da manhã simplesmente mostrando como fazê-lo

O Toyota Research Institute (TRI) usou inteligência artificial generativa para ensinar aos robôs algumas habilidades para preparar o café da manhã. E não exigiu centenas de horas de programação e trabalho adicional em bugs e correções. Em vez disso, os pesquisadores equiparam os robôs com sensores especiais que fornecem uma sensação de tato, conectaram-nos a um modelo de inteligência artificial e depois mostraram ao sistema o que fazer, escreve The Verge.

Fonte da imagem: Instituto de Pesquisa Toyota

Os pesquisadores observaram que o sentido do tato é “um dos fatores-chave” na aprendizagem. Graças ao toque, o robô consegue “sentir” o que está fazendo, obtendo mais informações. Isso torna tarefas complexas mais fáceis do que usar apenas câmeras.

De acordo com o pesquisador do laboratório TRI, Ben Burchfiel, “é interessante ver como eles (robôs) interagem com o meio ambiente”. Primeiro, um “professor” demonstra um conjunto de habilidades e depois, “durante várias horas”, o modelo aprende em segundo plano. “Normalmente treinamos o robô durante o dia, deixamos que ele aprenda a noite toda e então iniciamos o novo comportamento de trabalho na manhã seguinte”, explicou Burchfield.

Os pesquisadores disseram que estão tentando criar o que chamam de Grandes Modelos de Comportamento (LBM). Assim como os grandes modelos de linguagem (LLMs) aprendem observando padrões no texto, os modelos LBM da Toyota aprendem através da observação e depois “generalizam aplicando uma nova habilidade que nunca foram ensinadas”, diz Russ Tedrake, professor de robótica do Massachusetts Institute of Technology e vice-presidente de pesquisa em robótica do TRI. Usando esse método, os pesquisadores ensinaram aos robôs mais de 60 habilidades complexas, como “derramar líquidos, usar ferramentas e manipular objetos deformáveis”. Os pesquisadores do TRI planejam treinar robôs em até 1.000 habilidades até o final de 2024.

O Google está trabalhando em uma direção semelhante, criando o modelo de IA RT-2 (Robotics Transformer 2) da classe Vision-Language-Action (VLA). Semelhante ao design da Toyota, os robôs baseados no RT-2 usam sua experiência para tomar decisões sobre como agir. Teoricamente, os robôs treinados pela inteligência artificial poderiam eventualmente executar tarefas com pouca ou nenhuma instrução além das instruções gerais que normalmente seriam dadas a um ser humano, como “limpar uma mancha no chão”.

Como observou o The New York Times, esse tipo de trabalho (criar um modelo como RT) é geralmente “lento e trabalhoso”, e fornecer dados de treinamento suficientes é muito mais difícil do que simplesmente alimentar um modelo de IA com uma massa de dados que pode ser baixado da Internet.

avalanche

Postagens recentes

Hackers roubaram credenciais de funcionários da OpenAI após invadirem a biblioteca TanStack.

A OpenAI confirmou que hackers roubaram um conjunto limitado de credenciais após um ataque à…

20 minutos atrás

A Anthropic Mythos descobriu novas falhas de segurança no macOS.

O modelo de inteligência artificial Mythos, da Anthropic, identificou novas vulnerabilidades de segurança no sistema…

20 minutos atrás

A OpenAI pode processar a Apple pela má promoção do ChatGPT.

Segundo Mark Gurman, da Bloomberg, a OpenAI planeja processar a Apple devido ao relacionamento "tenso"…

9 horas atrás

O filme The Legend of Zelda será lançado antes do previsto – a estreia foi adiada novamente.

Shigeru Miyamoto, cocriador da série de jogos de ação e aventura The Legend of Zelda,…

9 horas atrás

O maior drone solar do mundo realizou um voo recorde e desapareceu no oceano.

O voo recorde de longa duração do singular avião não tripulado Skydweller, que durou do…

10 horas atrás

A Nvidia está a caminho de atingir uma capitalização de mercado de 6 trilhões de dólares, com suas ações subindo 20% em uma semana.

As ações da Nvidia subiram na quinta-feira, ampliando os ganhos de 20% acumulados nos últimos…

10 horas atrás