A Amazon pretende “relançar” a Alexa como um agente artificialmente inteligente que pode realizar tarefas práticas, mas para isso os técnicos da empresa terão que encontrar soluções para vários problemas que atualmente impedem a reconstrução do sistema.

Fonte da imagem: aboutamazon.com

A empresa vem tentando há dois anos dar nova vida ao assistente de voz, que é usado em 500 milhões de dispositivos em todo o mundo, transplantando nele um novo “cérebro” baseado em IA generativa. Isto é dificultado por vários problemas: alucinações de IA, isto é, dar respostas deliberadamente incorretas a pedidos; velocidade de resposta, ou seja, o atraso antes de receber uma resposta; e confiabilidade geral do sistema. Rohit Prasad, chefe da forte equipe de desenvolvimento de IA (AGI) da Amazon, ao Financial Times. Hoje Alexa só é capaz de realizar tarefas simples, como tocar música ou definir alarmes, mas a empresa pretende expandir suas capacidades para um agente completo que atue como concierge pessoal. Tal sistema, por exemplo, ajudará o usuário na escolha de um restaurante ou no ajuste da iluminação do quarto de acordo com os ciclos de sono.

O trabalho no projeto de relançamento do Alexa começou quando o OpenAI ChatGPT foi lançado no final de 2022. Microsoft, Google e Meta✴ incorporaram rapidamente IA generativa em suas plataformas de computação, melhoraram a qualidade de seus serviços de software e há dúvidas de que a Amazon cumpra sua visão a tempo de competir com outros gigantes da tecnologia. O assistente de voz atualmente funciona com algoritmos bem calibrados, mas a empresa encontrou dificuldades inesperadas na implementação de modelos de linguagem grandes mais poderosos, mas menos previsíveis. Integrar a IA generativa num serviço utilizado por centenas de milhões de pessoas em todo o mundo parece ser um projeto de complexidade sem precedentes para os especialistas da empresa, que não se limita à imposição mecânica de um grande modelo de linguagem no serviço Alexa.

Para que o sistema funcione como um agente, o “cérebro” da Alexa deve ser capaz de acessar centenas de programas e serviços. “Às vezes subestimamos quantos serviços estão integrados ao Alexa, e há um grande número deles. Esses aplicativos recebem bilhões de solicitações por semana, portanto, quando você está tentando realizar ações confiáveis ​​com rapidez, precisa ser capaz de fazê-lo de maneira muito econômica”, disse Rohit Prasad. Os usuários esperam que Alexa forneça respostas rápidas e precisas, o que vai contra a natureza probabilística da IA ​​generativa de hoje, que é um software estatístico que prevê sequências de palavras com base em padrões de fala e linguagem.

A Amazon está procurando recrutar especialistas para moldar a personalidade, a voz e a dicção da IA, para que ela permaneça familiar aos usuários do Alexa. E algo terá de ser feito em relação às “alucinações”, que, à escala do trabalho da Amazon, correm o risco de ocorrer muitas vezes ao dia. Apesar de a empresa empregar muitos especialistas fortes e possuir recursos financeiros impressionantes, os desenvolvedores devem enfrentar “problemas técnicos e burocráticos”: marcação de dados de baixa qualidade em matrizes de treinamento e documentação desatualizada ou ausente.

A implementação original do Alexa foi construída com base em tecnologia adquirida da startup britânica Evi em 2012 – uma máquina de perguntas e respostas que pesquisa uma série de fatos; As respostas podem ser uma previsão do tempo ou uma música da biblioteca de música. A tecnologia por trás do assistente de voz, que já era inflexível, era sobrecarregada por uma base de código desajeitada e desorganizada e por uma equipe de desenvolvimento altamente distribuída. A nova Alexa utiliza toda uma gama de modelos de IA: alguns servem para reconhecer e traduzir pedidos de voz e gerar respostas, outros desempenham uma função de monitorização, não permitindo respostas inadequadas e evitando a ocorrência de “alucinações”. Este conjunto inclui grandes modelos de linguagem da Amazon, incluindo o recentemente lançado Nova, bem como um produto de seu parceiro Anthropic Claude.

Os desenvolvedores da empresa agora pretendem integrar filtros adicionais para crianças e testar o desempenho de equipamentos integrados ao Alexa, como luzes inteligentes e campainhas. Os desenvolvedores de produtos de terceiros ainda não fizeram previsões sobre quando o Alexa atualizado aparecerá ou como poderá funcionar com serviços de terceiros. A Amazon os assustou ao instá-los a se preparar para uma atualização radical do assistente de voz, mas até agora tudo se acalmou. E a empresa não entende como o Alexa será monetizado – são permitidos cenários com a introdução de uma assinatura paga ou o recebimento de uma comissão pela venda de bens e serviços.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *