O assistente de IA Gemini Live do Google aprende a ver o mundo através da câmera de um smartphone — com precisão e sem atrasos

O Google anunciou diversos novos recursos para sua assistente virtual Gemini Live, com a qual os usuários podem interagir por meio de comandos de voz. Em um futuro próximo, a Gemini Live poderá reconhecer e destacar com mais precisão os objetos que o usuário “mostra” a ela usando a câmera do smartphone.

Fonte da imagem: Google

Essa inovação será útil em diversas situações. Por exemplo, quando um usuário não tiver certeza de qual ferramenta é a melhor para uma determinada tarefa, ele pode perguntar ao Gemini Live e usar a câmera para ajudar o assistente de IA a escolher a melhor opção. O recurso estará disponível nos smartphones Google Pixel 10 anunciados esta semana. Dicas visuais estarão disponíveis em outros dispositivos Android ainda este mês e no aplicativo iOS do assistente nas próximas semanas.

Ao mesmo tempo, os desenvolvedores expandiram os recursos do Gemini Live em termos de interação com outros aplicativos, incluindo Telefone, Mensagens e Relógio. Por exemplo, se um usuário discutir uma rota para um determinado ponto com o Gemini Live, mas entender que não conseguirá chegar lá a tempo, o usuário pode informar ao assistente de IA que a rota proposta lhe convém, mas precisa redigir e enviar uma mensagem para um dos contatos informando que sofrerá um atraso de alguns minutos. Depois disso, o Gemini Live gerará e enviará uma mensagem de forma independente para o contato especificado, avisando-o sobre o atraso com antecedência.

O Google também anunciou o lançamento de um modelo de áudio atualizado para o Gemini Live. Graças a isso, o algoritmo reconhecerá melhor a entonação, o ritmo e o tom de voz de uma pessoa. Em breve, o assistente de IA aprenderá a alterar a entonação dependendo do assunto em discussão. Além disso, o usuário poderá acelerar e desacelerar o Gemini Live conforme for mais conveniente para ele interpretar as respostas do assistente de IA. Se o usuário pedir ao Gemini Live para recontar dramaticamente uma história em nome de um personagem ou figura histórica específica, o algoritmo será capaz de fornecer uma “narrativa rica e envolvente”.

admin

Postagens recentes

A Qualcomm espera faturar US$ 15 bilhões por ano com a venda de chips para servidores até 2029.

O relatório trimestral da Qualcomm veio acompanhado do anúncio dos processadores de servidor Dragonfly C1000,…

32 minutos atrás

Uma versão reforçada do cão robô chinês Lynx M20S escalou encostas de montanhas em temperaturas de -30 graus.

A empresa chinesa DEEP Robotics demonstrou a incrível resistência e capacidade de transposição de terrenos…

6 horas atrás

O aclamado simulador de sobrevivência DayZ ganhará uma sequência – a Bohemia Interactive anunciou oficialmente DayZ 2.

Os desenvolvedores do estúdio tcheco Bohemia Interactive confirmaram o desenvolvimento de uma sequência para o…

8 horas atrás

Em busca de férmions de Majorana: cientistas questionam novamente a tecnologia de computação quântica da Microsoft.

Uma nova crítica publicada na revista científica Nature levanta questões sobre o avanço da computação…

8 horas atrás

A Zoox atualizou seu serviço de robotáxis, com o lançamento do transporte público pago previsto para o final do ano.

A Zoox, empresa pertencente à Amazon, atualizou o design de seu robotáxi especializado. A Zoox…

10 horas atrás

Warhammer 40.000: Rogue Trader atingiu um novo pico de vendas e chegará ao formato físico pela primeira vez.

Após o fracasso do Owlcat Launcher, a Owlcat Games anunciou o sucesso de seu jogo…

11 horas atrás