O Google lançou a rede neural Gemini 1.5 com um enorme menu de contexto – a IA dominará todo o “Senhor dos Anéis” de uma vez

Menos de dois meses se passaram desde o lançamento da rede neural avançada Gemini, e o Google já anunciou seu sucessor. O modelo maior de linguagem Gemini 1.5 foi revelado hoje e está imediatamente disponível para desenvolvedores e usuários corporativos, com distribuição aos consumidores começando em breve. O Google deixou claro que deseja usar o Gemini como ferramenta de negócios, assistente pessoal e muito mais.

Gemini 1.5 tem muitas melhorias. O Gemini 1.5 Pro, que irá alimentar muitos dos serviços do Google, supera o Gemini 1.0 Pro em 87% nos testes, colocando-o quase no mesmo nível do Gemini 1.0 Ultra topo de linha. Ao criar um novo modelo, é utilizada a abordagem cada vez mais popular “Mixtura de Especialistas” (MoE), o que implica que, ao enviar uma solicitação, apenas parte do modelo geral é lançada, e não o todo. Essa abordagem deve tornar o modelo mais rápido para o usuário e mais eficiente para o Google.

Mas há uma novidade no Gemini 1.5 que deixa todos no Google, começando pelo CEO Sundar Pichai, especialmente entusiasmados. A nova versão da rede neural possui uma enorme janela de contexto, o que significa que ela pode processar consultas muito maiores e visualizar muito mais informações de uma só vez. O tamanho da janela é de 1 milhão de tokens, muito maior que os 128.000 tokens do GPT-4 da OpenAI e os 32.000 do atual Gemini Pro. “São cerca de 10 ou 11 horas de vídeo, dezenas de milhares de linhas de código”, observou Pichai. Ele também acrescentou que os pesquisadores do Google estão testando uma janela de contexto para 10 milhões de tokens – isto é, por exemplo, toda a série Game of Thrones em uma solicitação.

Por exemplo, Pichai diz que toda a trilogia O Senhor dos Anéis poderia caber nesta janela contextual. Isso parece muito específico, mas talvez alguém no Google verifique se Gemini encontrará algum erro de continuidade ao tentar entender a complexa ancestralidade da Terra-média. Ou a IA pode ser capaz de entender Tom Bombadil.

Pichai também acredita que uma janela contextual maior será muito útil para os negócios. “Isso permitirá que você use exemplos onde poderá adicionar muito contexto e informações pessoais no ponto de investigação”, diz ele. “Considere que expandimos significativamente a janela de solicitação.” O chefe do Google prevê que os cineastas possam enviar o filme inteiro e perguntar ao Gemini o que os críticos dizem, e que as empresas possam usar o Gemini para processar resmas de documentos financeiros. “Considero este um dos maiores avanços que fizemos”, diz ele.

Por enquanto, o Gemini 1.5 estará disponível apenas para usuários empresariais e desenvolvedores por meio do Google Vertex AI e AI Studio. Eventualmente, ele substituirá o Gemini 1.0, e a versão padrão do Gemini Pro – disponível para todos em gemini.google.com e aplicativos do Google – será substituída pelo 1.5 Pro com uma janela contextual para 128.000 tokens. Para conseguir um milhão, você tem que pagar a mais. O Google também está testando os limites éticos e de segurança do modelo, especialmente no que diz respeito à nova janela de contexto mais ampla.

O Google está agora em uma corrida frenética para criar a melhor ferramenta de IA, enquanto empresas ao redor do mundo tentam definir sua própria estratégia de IA e fazer parceria com OpenAI, Google ou quem quer que seja. Recentemente, a OpenAI anunciou uma “memória” para ChatGPT e parece estar se preparando para entrar no mercado de busca na web. Embora o Gemini pareça impressionante, especialmente para quem já faz parte do ecossistema Google, a empresa ainda tem muito trabalho a fazer.

No final, diz Pichai, todas essas batalhas 1.0 e 1.5, Pro e Ultra e empresariais não importarão para os usuários. “As pessoas simplesmente consumirão uma experiência de usuário melhor”, diz ele. “É como usar um smartphone sem prestar atenção ao processador interno.” Mas, por enquanto, diz ele, ainda estamos no estágio em que todos sabem qual chip está dentro de seus telefones, porque isso é importante. “A tecnologia subjacente está mudando muito rapidamente”, afirma o CEO do Google. “As pessoas se importam.”

avalanche

Postagens recentes

Uma fera ou um homem: Cyberia Nova mostrou o inimigo “mais incomum” em “Troubles”

Os criadores do histórico RPG de ação "Trouble" da Cyberia Nova continuam a entreter os…

39 minutos atrás

No Windows 11, uma das deficiências do Explorer será corrigida – ícones no menu de contexto terão legendas

Três anos após o lançamento do Windows 11, a Microsoft planeja adicionar legendas aos ícones…

1 hora atrás

Deep Silver se gabou das vendas do Metro Exodus e sugeriu quando esperar uma nova peça

O microblog oficial da série Metro lembrou que hoje, 15 de fevereiro de 2024, o…

2 horas atrás

Bose lança fones de ouvido Ultra Open por US$ 299

A Bose lançou os Ultra Open Earbuds, fones de ouvido “totalmente abertos” de US$ 299…

2 horas atrás

OpenAI está desenvolvendo um mecanismo de busca de IA que irá competir com o Google

Tendo assumido uma posição de liderança na corrida da IA ​​generativa, a OpenAI está enfrentando…

2 horas atrás