O assistente de IA Gemini Live do Google aprende a ver o mundo através da câmera de um smartphone — com precisão e sem atrasos

O Google anunciou diversos novos recursos para sua assistente virtual Gemini Live, com a qual os usuários podem interagir por meio de comandos de voz. Em um futuro próximo, a Gemini Live poderá reconhecer e destacar com mais precisão os objetos que o usuário “mostra” a ela usando a câmera do smartphone.

Fonte da imagem: Google

Essa inovação será útil em diversas situações. Por exemplo, quando um usuário não tiver certeza de qual ferramenta é a melhor para uma determinada tarefa, ele pode perguntar ao Gemini Live e usar a câmera para ajudar o assistente de IA a escolher a melhor opção. O recurso estará disponível nos smartphones Google Pixel 10 anunciados esta semana. Dicas visuais estarão disponíveis em outros dispositivos Android ainda este mês e no aplicativo iOS do assistente nas próximas semanas.

Ao mesmo tempo, os desenvolvedores expandiram os recursos do Gemini Live em termos de interação com outros aplicativos, incluindo Telefone, Mensagens e Relógio. Por exemplo, se um usuário discutir uma rota para um determinado ponto com o Gemini Live, mas entender que não conseguirá chegar lá a tempo, o usuário pode informar ao assistente de IA que a rota proposta lhe convém, mas precisa redigir e enviar uma mensagem para um dos contatos informando que sofrerá um atraso de alguns minutos. Depois disso, o Gemini Live gerará e enviará uma mensagem de forma independente para o contato especificado, avisando-o sobre o atraso com antecedência.

O Google também anunciou o lançamento de um modelo de áudio atualizado para o Gemini Live. Graças a isso, o algoritmo reconhecerá melhor a entonação, o ritmo e o tom de voz de uma pessoa. Em breve, o assistente de IA aprenderá a alterar a entonação dependendo do assunto em discussão. Além disso, o usuário poderá acelerar e desacelerar o Gemini Live conforme for mais conveniente para ele interpretar as respostas do assistente de IA. Se o usuário pedir ao Gemini Live para recontar dramaticamente uma história em nome de um personagem ou figura histórica específica, o algoritmo será capaz de fornecer uma “narrativa rica e envolvente”.

admin

Postagens recentes

A Nokia já está se preparando para o desenvolvimento do Wi-Fi 9.

A Nokia delineou sua visão para o futuro padrão sem fio Wi-Fi 9, projetado para…

4 horas atrás

A Apple não abandonou os planos de lançar um iPad mais acessível com o chip A18 nesta primavera.

Contrariando as expectativas, os anúncios da Apple em março não mencionaram um iPad básico com…

5 horas atrás

A LG iniciou a produção em massa de telas para laptops com taxa de atualização variável de 1 a 120 Hz.

A LG Display anunciou o início da produção em massa dos primeiros painéis LCD do…

7 horas atrás

A LG iniciou a produção em massa de telas para laptops com taxa de atualização variável de 1 a 120 Hz.

A LG Display anunciou o início da produção em massa dos primeiros painéis LCD do…

7 horas atrás

“Destruição do Patrimônio da Humanidade” – Astrônomos protestam contra data centers e espelhos no espaço.

Astrônomos estão soando o alarme, protestando contra a implementação de dois projetos de grande escala…

8 horas atrás

Os programadores estão usando cada vez mais IA, e em algumas empresas isso se tornou até uma competição.

Algumas empresas de tecnologia criaram rankings que demonstram o quão ativamente seus funcionários usam algoritmos…

8 horas atrás