Cientistas do MIT descobriram um método eficaz para ensinar robôs a partir de grandes modelos de linguagem de IA

Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) desenvolveram seu próprio método para ensinar novas habilidades aos robôs. Em vez do conjunto padrão de dados focados que normalmente é usado para treinar robôs, eles usaram grandes conjuntos de dados, simulando assim o processo de treinamento de grandes modelos de linguagem (LLMs).

Fonte da imagem: mit

Segundo pesquisadores do MIT, a aprendizagem por imitação, quando um robô aprende com as ações de uma pessoa que executa uma tarefa específica, pode não ser eficaz quando o ambiente muda de forma insignificante. Por exemplo, o robô pode ter dificuldades após o treinamento se for colocado em um ambiente com iluminação ou objetos diferentes.

Em seu trabalho, os pesquisadores utilizaram diferentes LLMs, como o GPT-4, para melhorar a qualidade do aprendizado por força bruta. “No campo dos modelos de linguagem, todos os dados são apenas frases. Na robótica, dada toda a heterogeneidade dos dados, se quisermos fazer o pré-treinamento de forma semelhante, então precisamos de uma arquitetura diferente”, disse Lirui Wang, um dos autores do estudo.

Os pesquisadores desenvolveram uma nova arquitetura chamada Transformadores Pré-treinados Heterogêneos (HPT), que combina informações de diferentes sensores e diferentes ambientes. Os dados recolhidos desta forma são combinados em modelos treináveis ​​através de um “transformador”. O usuário final só precisa especificar o design do robô, sua configuração e a habilidade que ele precisa aprender.

«Nosso sonho é criar um cérebro robótico universal que você possa baixar e usar em seu robô sem nenhum treinamento. Ainda estamos nos estágios iniciais, mas continuaremos trabalhando duro e esperamos que o dimensionamento leve a um avanço na robótica, como aconteceu com grandes modelos de linguagem”, disse um dos autores do estudo, David Held.

avalanche

Postagens recentes

Cientistas detectaram pela primeira vez como um jato de plasma de um buraco negro explodiu algo em seu caminho

Pela primeira vez, o telescópio de raios X Chandra da NASA detectou os efeitos destrutivos…

23 minutos atrás

Samsung mostrou o laptop Galaxy Book5 Pro no Intel Lunar Lake com suporte de IA da Microsoft e Samsung

A Samsung apresentou o laptop Galaxy Book5 Pro baseado em processadores Intel Lunar Lake (Core…

2 horas atrás

Cientistas descobriram acidentalmente uma partícula que ganha ou perde massa dependendo da direção em que se move

Um grupo de cientistas da Universidade da Pensilvânia e da Universidade de Columbia descobriu pela…

3 horas atrás