Waymo e Gemini ensinarão robotáxis a lidar com situações difíceis de trânsito

Waymo, uma subsidiária da Alphabet, introduziu uma nova abordagem para treinar seus veículos autônomos usando o modelo Gemini, um grande modelo de linguagem multimodal (MLLM) do Google. O modelo irá melhorar a navegação dos carros autônomos e permitir-lhes lidar melhor com situações rodoviárias complexas.

Fonte da imagem: waymo.com

Em um novo artigo de pesquisa, Waymo definiu seu desenvolvimento como um “modelo multimodal ponta a ponta para direção autônoma” (EMMA), que processa dados de sensores e ajuda os robotáxis a tomar decisões sobre a direção da viagem, evitando obstáculos. De acordo com o The Verge, a Waymo há muito enfatiza sua vantagem estratégica devido ao acesso à pesquisa científica na área de inteligência artificial (IA) do Google DeepMind, anteriormente propriedade da empresa britânica DeepMind Technologies.

O novo sistema EMMA representa uma abordagem fundamentalmente diferente para a formação de veículos autónomos. Em vez dos sistemas modulares tradicionais que separam as funções em percepção, planejamento de rotas e outras tarefas, o EMMA oferece uma abordagem unificada que permitirá que os dados sejam processados ​​de forma holística, ajudará a evitar erros que ocorrem durante a transferência de dados entre módulos e melhorará a adaptação a estradas novas e desconhecidas. condições em tempo real.

Um dos principais benefícios da utilização de modelos MLLM, em particular Gemini, é a sua capacidade de generalizar o conhecimento obtido a partir de grandes quantidades de dados obtidos na Internet. Isto permite que os modelos se adaptem melhor a situações inusitadas na estrada, como o aparecimento inesperado de animais ou trabalhos de reparação. Além disso, os modelos treinados no Gemini são capazes de “cadeia de raciocínio”. É uma técnica que ajuda a dividir problemas complexos em etapas sequenciais e lógicas, melhorando a tomada de decisões.

Apesar dos seus sucessos, a Waymo reconhece que o EMMA tem as suas limitações. Por exemplo, o modelo ainda não suporta o processamento de dados 3D de sensores como lidar ou radar devido à alta complexidade computacional. Além disso, o EMMA só pode processar um número limitado de quadros de imagem por vez. Ressalta-se que serão necessárias mais pesquisas para superar todas essas limitações antes da plena implementação do modelo em condições reais.

A Waymo também reconhece os riscos associados ao uso do MLLM para dirigir veículos autônomos. Modelos como Gêmeos podem cometer erros ou “alucinar” em tarefas simples, o que obviamente é inaceitável na estrada. No entanto, espera-se que novas pesquisas e melhorias na arquitetura de modelos de IA para condução autônoma superem esses problemas.

avalanche

Postagens recentes

O Adobe Acrobat agora permite editar PDFs usando instruções, criar apresentações e adicionar narração a documentos.

A Adobe adicionou um conjunto de novos recursos com inteligência artificial (IA) ao Acrobat. Agora…

24 minutos atrás

A Ubisoft cancelou o remake de Prince of Persia: The Sands of Time cinco anos após seu anúncio.

O remake do cultuado jogo de ação e aventura Prince of Persia: The Sands of…

1 hora atrás

AMD lança o driver Radeon 26.1.1: suporte para Ryzen AI 400, um grande pacote de IA e atualizações para Black Ops 7 e outros jogos.

A AMD lançou a versão mais recente do driver Radeon Software Adrenalin 26.1.1 WHQL. Este…

1 hora atrás

O autor de um mod de realidade virtual bloqueado para Cyberpunk 2077 permitiu o lançamento de uma versão gratuita, mas os piratas já se adiantaram.

Luke Ross, criador do mod pago de realidade virtual para Cyberpunk 2077, que foi bloqueado…

2 horas atrás

As autoridades americanas ajudarão a startup Type One Energy a transformar suas ambições de fusão em um reator real.

Os inúmeros anúncios dos últimos anos sobre o desenvolvimento de reatores de fusão avançados dificilmente…

3 horas atrás

A Nvidia é acusada de negociar com piratas o acesso a 500 TB de livros para treinamento de IA.

Uma ação coletiva emendada, apresentada no Tribunal Distrital dos Estados Unidos para o Distrito Norte…

3 horas atrás