A China demonstrou mais uma vez seu rápido desenvolvimento em inteligência artificial. Enquanto o resto do mundo observa assistentes de IA dispersos, recursos de IA e raros casos de interação de aplicativos em smartphones, a ZTE e a ByteDance desenvolveram um smartphone com um agente de IA integrado ao sistema operacional. Ele controla todas as funções do dispositivo como um humano.

Fonte da imagem: x.com/TaylorOgan

O protótipo de smartphone ZTE Nubia M153 roda uma versão modificada do Android integrada com o agente de IA Doubao, da ByteDance. Doubao é um ecossistema conhecido na China por seus modelos de IA de uso geral, utilizados em chatbots e aplicativos de produtividade. No caso do ZTE Nubia M153, não se trata apenas de um assistente de IA típico — o agente controla totalmente o smartphone: ele exibe a interface do usuário, baixa e inicia aplicativos, interage com suas funções, digita textos, faz chamadas e executa tarefas complexas.

O usuário pode nem saber quais aplicativos são necessários para concluir suas tarefas — a IA controla o smartphone como um humano, não como um aplicativo. Em um exemplo, o agente encontrou alguém disposto a esperar na fila para o usuário: ele encontrou e instalou um aplicativo de serviço local, definiu uma tarefa, preencheu os campos obrigatórios do formulário e exibiu a tela final para confirmar o pedido. O próprio usuário não tinha conhecimento prévio de qual aplicativo poderia executar essa tarefa ou como configurá-lo. O agente de IA fez tudo sozinho.

O protótipo do smartphone ZTE Nubia M153 utiliza o mais recente chip Qualcomm Snapdragon 8 Elite Gen 5 com 16 GB de RAM. A análise da interface da tela e as funções de controle são realizadas localmente pela IA no dispositivo, enquanto a análise semântica e as operações mais complexas são executadas em recursos remotos na nuvem. Essa distribuição de tarefas permite que a IA trabalhe rapidamente e garanta a segurança de dados sensíveis, como senhas e informações de pagamento.

Aplicativos baseados nesse modelo da ByteDance Doubao são usados ​​por mais de 175 milhões de pessoas na China.A plataforma utiliza uma arquitetura esparsa de “mistura especializada” e é multimodal, ou seja, funciona com texto e imagens. Em um exemplo, a IA em um smartphone identificou uma estação de troca de baterias de veículos elétricos da NIO a partir de uma foto e explicou seu funcionamento.

Uma demonstração mais impressionante envolveu a reserva de um quarto de hotel: o usuário tirou uma foto da entrada do hotel e indicou sua intenção de reservar. A Doubao, na nuvem, interpretou a semântica: identificou o hotel, percebeu que um quarto era necessário para aquele dia e esclareceu a política para animais de estimação. A Nebula-GUI, uma rede neural treinada pela ZTE com 7 bilhões de parâmetros, realizou as operações: abriu o aplicativo de reservas, inseriu as datas, selecionou os melhores preços, esclareceu a política para animais de estimação e informou o usuário sobre ela. A arquitetura de duas camadas garante uma operação fluida: a Doubao planeja e a Nebula-GUI executa.

Outra demonstração envolveu a solicitação de um robotáxi. A Doubao obteve dados de posicionamento por satélite e pesquisou aplicativos de transporte locais para identificar a operadora que atendia a uma rota específica. A interface gráfica Nebula-GUI iniciou o aplicativo Baidu Apollo, selecionou os pontos de partida e destino e confirmou a viagem. O usuário solicitou uma alteração no local de desembarque durante a viagem — a IA reconheceu a viagem ativa no Apollo, abriu a tela apropriada, alterou o destino e confirmou a alteração no smartphone e no próprio robotáxi. Quando o usuário esqueceu o número de telefone vinculado à sua conta no aplicativo, a IA encontrou essa informação e forneceu os quatro últimos dígitos — necessários para acessar o veículo.

O último grandeUm exemplo foi um pedido de comida — neste caso, duas bebidas — feito pelo Meituan, um serviço de entrega por drones. A IA colocou o pedido no ponto de coleta automatizado mais próximo e, quando o sistema do Meituan fez uma ligação de confirmação, o Doubao respondeu em nome do usuário e conversou com o bot do Meituan. Os dois bots negociaram com sucesso sem qualquer intervenção humana. Enquanto isso, durante a caminhada, o usuário utilizou seu smartphone como ferramenta para avaliar o ambiente ao seu redor, fazendo perguntas sobre estabelecimentos e pessoas que encontrava pelo caminho.

Assim, o protótipo de smartphone adquiriu a capacidade de controlar totalmente sua própria interface gráfica, auxiliado por um poderoso modelo multimodal com raciocínio lógico. O usuário não precisa mais entender as complexidades do uso de aplicativos — basta dizer ao smartphone qual o resultado desejado. Nenhum fabricante de smartphones demonstrou ainda tais capacidades. Não está claro se um dispositivo como esse chegará ao mercado, mas o protótipo demonstrou como smartphones com agentes de IA podem transformar a vida moderna.

Taylor Ogan, chefe do fundo de hedge Snow Bull Capital, que demonstrou o smartphone em funcionamento, ficou muito impressionado com o dispositivo e classificou sua chegada como um potencial novo “momento DeepSeek”, sugerindo que seu lançamento irá revolucionar o setor, assim como o tão aguardado modelo de IA chinês fez.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *