O Google anunciou o lançamento do Gemini, um modelo de inteligência artificial que impulsionará os recursos de IA da empresa e desafiará concorrentes, incluindo o ChatGPT da OpenAI. Segundo o CEO do Google, Sundar Pichai, o surgimento do novo algoritmo marca o início de uma nova era de inteligência artificial na empresa.
Fonte da imagem: Google
«Uma das coisas mais importantes sobre isso é que você pode trabalhar em uma tecnologia central e melhorá-la, e ela se espalhará imediatamente por todos os nossos produtos”, disse Pichai.
O CEO do Google observou que o lançamento do modelo de linguagem Gemini é um grande passo em frente e acabará por impactar quase todos os produtos da empresa. Gêmeos é mais do que apenas um modelo de linguagem. Existe uma versão mais leve do modelo Gemini Nano AI, projetada para funcionar de forma autônoma em dispositivos Android. Além disso, existe uma versão mais poderosa do Gemini Pro, que se tornará a base de muitos serviços do Google no futuro, e a partir de hoje é a base do chatbot Bard. Além disso, o Google criou o modelo Gemini Ultra AI, que é o modelo de linguagem mais poderoso da empresa e se destina principalmente ao uso em data centers e integração com aplicativos corporativos.
A empresa está trazendo seu modelo de IA para o mercado consumidor de diversas maneiras. O chatbot Bard agora é desenvolvido com Gemini Pro, e os usuários do Pixel 8 Pro terão acesso a vários novos recursos graças à integração com Gemini Nano. Gemini Ultra estará disponível no próximo ano. Desenvolvedores e clientes corporativos poderão acessar o Gemini Pro por meio do Google Generative AI Studio ou Vertex AI no Google Cloud a partir de 13 de dezembro. Neste momento, o Gemini pode processar pedidos em inglês, mas é óbvio que no futuro haverá suporte para outros idiomas.
Segundo Sundar Pichai, este modelo de IA será eventualmente integrado no motor de busca do Google, nos produtos publicitários da empresa, no navegador Chrome e noutros serviços. Parece que o Google, que criou grande parte da tecnologia fundamental por trás do atual boom da IA e se autodenomina uma empresa focada em IA há cerca de uma década, está pronto para reagir com seu ChatGPT de um ano de idade, que era tão bom que fez pessoas nervosas gigante de TI.
Como parte da apresentação do Gemini, o CEO do Google DeepMind, Demis Hassabis, disse que o Google conduziu uma comparação completa de seu modelo de linguagem com o GPT-4, a versão mais atual da rede neural subjacente ao ChatGPT. “Realizamos uma análise comparativa muito completa dos sistemas. Acho que estamos significativamente à frente em 30 das 32 métricas”, disse Hassabis, apontando para 32 testes de comparação de grandes modelos de linguagem bem estabelecidos. Ele também observou que em alguns testes a superioridade do Gemini sobre o GPR-4 é mínima, enquanto em outros é mais perceptível.
Nestes testes, a vantagem mais óbvia do Gemini foi a sua capacidade de compreender e interagir com vídeo e áudio. Em geral, era isso que o Google pretendia, já que a empresa não criou modelos de IA separados para processamento de imagem e áudio, como a OpenAI fez com o DALL-E e o Whisper. Desde o início, o Google trabalhou para criar um modelo único que pudesse reconhecer imagens e sons. Atualmente, as versões básicas do Gemini suportam entrada e saída de texto, mas versões mais poderosas do algoritmo, como o Gemini Ultra, podem trabalhar com imagens, vídeo e áudio. É claro que esses modelos ainda são alucinantes e não estão isentos de preconceitos e outros problemas, mas com o tempo o Google planeja melhorar sua compreensão do mundo ao seu redor.
Apesar dos testes realizados pelos desenvolvedores, o teste principal do Gemini será realizado por usuários comuns que desejam utilizar o algoritmo para buscar informações, criar conteúdo, escrever códigos de programas e muito mais. Em termos de geração de código, o algoritmo do Google utiliza o novo sistema AlphaCode 2, que, segundo a empresa, tem desempenho melhor que 85% dos concorrentes e 50% melhor que o algoritmo AlphaCode original.
Tão importante quanto para o Google, o Gemini é provavelmente o seu modelo de melhor desempenho. Ele foi treinado usando processadores tensores do Google, permitindo que ele fosse executado de forma mais rápida e eficiente do que os algoritmos anteriores da empresa, como o PaLM. Junto com o novo modelo de linguagem, o Google introduziu aceleradores TPU v5p, projetados para uso em data centers para treinar e executar grandes modelos de linguagem.
A apresentação do Gemini deixa claro que o Google vê o novo algoritmo como um projeto de grande escala e ao mesmo tempo um grande avanço para toda a empresa. Gemini é o modelo de IA que o Google vem construindo há anos, talvez até mesmo aquele que deveria ter lançado antes do ChatGPT dominar o mundo. O Google tem se esforçado muito para garantir a segurança e confiabilidade do Gemini realizando testes internos e externos do algoritmo, mas isso, segundo executivos da empresa, não garante que a rede neural funcionará sem erros.
Durante anos, Sundar Pichai e outros executivos da Goole tornaram-se poéticos sobre o potencial da inteligência artificial. O próprio Pichai disse repetidamente que a IA terá um impacto mais forte na humanidade do que o fogo ou a eletricidade. A primeira geração do Gemini provavelmente não mudará o mundo. Na melhor das hipóteses, ajudará a empresa a alcançar o ChatGPT, mas os executivos do Google estão confiantes de que este é o início de algo maior.
A Microsoft informou que, às 8h45 (horário de Moscou) do dia 6 de setembro, começaram…
Esta semana, a empresa chinesa Tencent revelou um novo modelo de IA de código aberto,…
Estatísticas publicadas recentemente pela Jon Peddie Research afirmam que a participação da AMD no mercado…
A NVIDIA, fornecedora e investidora da Lambda, tornou-se sua maior cliente. De acordo com o…
A OpenAI reorganizou sua equipe de Comportamento de Modelos, responsável pelas características comportamentais dos modelos…
Quanto mais próximo o dia 9 de setembro, mais ativamente os analistas do setor discutem…