O Google abriu o acesso à versão beta da rede neural Gemini 1.5 Pro para todos os usuários. O pesquisador-chefe do Google DeepMind, Jeff Dean, anunciou isso na rede social X. “Primeiro, conectaremos gradualmente as pessoas à API e depois a desenvolveremos. Enquanto isso, os desenvolvedores podem experimentar o Gemini 1.5 Pro na interface de usuário do AI Studio agora mesmo”, disse Dean.
Gemini 1.5 Pro funciona com uma janela de contexto padrão de 128.000 tokens, embora o volume de processamento possa ser aumentado para 1 milhão de tokens. Ao mesmo tempo, o Gemini 1.5 Pro é capaz de processar até uma hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas de código ou mais de 700.000 palavras. Durante o estudo, o Google também testou com sucesso o processamento de até 10 milhões de tokens.
Usando a arquitetura Transformer e MoE, o Gemini 1.5 combina os pontos fortes de ambos os modelos. O Gemini 1.5 Pro se destaca em diversas tarefas, como análise de documentos históricos, como a transcrição da missão Apollo 11. Uma rede neural é capaz não apenas de analisar grandes blocos de dados, mas também de encontrar rapidamente um trecho específico de texto dentro deles. O Gemini 1.5 também lida com grandes blocos de código com eficiência. Na interface do AI Studio, a rede neural está disponível atualmente com limite de 20 solicitações por dia.
No teste Needle In A Haystack (NIAH), a rede neural atinge 99% de sucesso na detecção de fatos específicos em textos longos. E a capacidade de aprender sob condições específicas, demonstrada no benchmark Machine Translation from One Book (MTOB), torna o Gemini 1.5 um dos líderes em capacidades de aprendizagem adaptativa.