Menos de dois meses se passaram desde o lançamento da rede neural avançada Gemini, e o Google já anunciou seu sucessor. O modelo maior de linguagem Gemini 1.5 foi revelado hoje e está imediatamente disponível para desenvolvedores e usuários corporativos, com distribuição aos consumidores começando em breve. O Google deixou claro que deseja usar o Gemini como ferramenta de negócios, assistente pessoal e muito mais.

Gemini 1.5 tem muitas melhorias. O Gemini 1.5 Pro, que irá alimentar muitos dos serviços do Google, supera o Gemini 1.0 Pro em 87% nos testes, colocando-o quase no mesmo nível do Gemini 1.0 Ultra topo de linha. Ao criar um novo modelo, é utilizada a abordagem cada vez mais popular “Mixtura de Especialistas” (MoE), o que implica que, ao enviar uma solicitação, apenas parte do modelo geral é lançada, e não o todo. Essa abordagem deve tornar o modelo mais rápido para o usuário e mais eficiente para o Google.

Mas há uma novidade no Gemini 1.5 que deixa todos no Google, começando pelo CEO Sundar Pichai, especialmente entusiasmados. A nova versão da rede neural possui uma enorme janela de contexto, o que significa que ela pode processar consultas muito maiores e visualizar muito mais informações de uma só vez. O tamanho da janela é de 1 milhão de tokens, muito maior que os 128.000 tokens do GPT-4 da OpenAI e os 32.000 do atual Gemini Pro. “São cerca de 10 ou 11 horas de vídeo, dezenas de milhares de linhas de código”, observou Pichai. Ele também acrescentou que os pesquisadores do Google estão testando uma janela de contexto para 10 milhões de tokens – isto é, por exemplo, toda a série Game of Thrones em uma solicitação.

Por exemplo, Pichai diz que toda a trilogia O Senhor dos Anéis poderia caber nesta janela contextual. Isso parece muito específico, mas talvez alguém no Google verifique se Gemini encontrará algum erro de continuidade ao tentar entender a complexa ancestralidade da Terra-média. Ou a IA pode ser capaz de entender Tom Bombadil.

Pichai também acredita que uma janela contextual maior será muito útil para os negócios. “Isso permitirá que você use exemplos onde poderá adicionar muito contexto e informações pessoais no ponto de investigação”, diz ele. “Considere que expandimos significativamente a janela de solicitação.” O chefe do Google prevê que os cineastas possam enviar o filme inteiro e perguntar ao Gemini o que os críticos dizem, e que as empresas possam usar o Gemini para processar resmas de documentos financeiros. “Considero este um dos maiores avanços que fizemos”, diz ele.

Por enquanto, o Gemini 1.5 estará disponível apenas para usuários empresariais e desenvolvedores por meio do Google Vertex AI e AI Studio. Eventualmente, ele substituirá o Gemini 1.0, e a versão padrão do Gemini Pro – disponível para todos em gemini.google.com e aplicativos do Google – será substituída pelo 1.5 Pro com uma janela contextual para 128.000 tokens. Para conseguir um milhão, você tem que pagar a mais. O Google também está testando os limites éticos e de segurança do modelo, especialmente no que diz respeito à nova janela de contexto mais ampla.

O Google está agora em uma corrida frenética para criar a melhor ferramenta de IA, enquanto empresas ao redor do mundo tentam definir sua própria estratégia de IA e fazer parceria com OpenAI, Google ou quem quer que seja. Recentemente, a OpenAI anunciou uma “memória” para ChatGPT e parece estar se preparando para entrar no mercado de busca na web. Embora o Gemini pareça impressionante, especialmente para quem já faz parte do ecossistema Google, a empresa ainda tem muito trabalho a fazer.

No final, diz Pichai, todas essas batalhas 1.0 e 1.5, Pro e Ultra e empresariais não importarão para os usuários. “As pessoas simplesmente consumirão uma experiência de usuário melhor”, diz ele. “É como usar um smartphone sem prestar atenção ao processador interno.” Mas, por enquanto, diz ele, ainda estamos no estágio em que todos sabem qual chip está dentro de seus telefones, porque isso é importante. “A tecnologia subjacente está mudando muito rapidamente”, afirma o CEO do Google. “As pessoas se importam.”

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *