A versão mais recente do modelo de linguagem grande Gemini 1.5 Pro subitamente chegou ao topo do ranking da plataforma Chatbot Arena, derrotando os líderes tradicionais no campo da inteligência artificial generativa – OpenAI GPT-4o e Anthropic Claude-3 em testes .

Fonte da imagem: blog.google

A anteriormente campeã rede neural OpenAI GPT-4o perdeu a liderança em 1º de agosto, quando o Google lançou discretamente uma versão experimental de seu modelo mais recente – ela rapidamente atraiu uma comunidade interessada em IA nas redes sociais, que considerou a vitória no benchmark uma prova de qualidade . OpenAI ChatGPT tornou-se quase sinônimo de IA generativa desde seu lançamento na era GPT-3. Até o momento, os líderes estabelecidos são OpenAI GPT-4o e Anthropic Claude-3, que no ano passado quase não tiveram concorrentes nos testes.

Fonte da imagem: x.com/lmsysorg

Um dos testes mais populares é o LMSYS Chatbot Arena. Ele oferece aos modelos várias tarefas e atribui-lhes pontuações. A versão atual do GPT-4o conseguiu marcar 1.286 pontos, e Claude-3 – 1.271 pontos. O anterior Google Gemini 1.5 Pro teve uma pontuação de 1.261, mas o Gemini 1.5 Pro 0801 lançado em 1º de agosto de repente marcou impressionantes 1.300 pontos. Isso pode indicar que a nova rede neural do Google é mais capaz do que seus concorrentes, mas os benchmarks nem sempre refletem com precisão o que um modelo de IA pode ou não fazer.

O mercado atual de chatbots está maduro o suficiente para oferecer ao consumidor múltiplas opções e permitir que ele decida por si mesmo qual IA é mais adequada. Ainda não está claro se o Gemini 1.5 Pro experimental se tornará a versão padrão no futuro. Permanece disponível publicamente, mas com status experimental pode ser fechado ou editado radicalmente por segurança ou outros motivos.

avalanche

Postagens recentes

O designer chefe da CI Games revelou a data de lançamento de Lords of the Fallen 2.

Enquanto os fãs aguardam a confirmação da data de lançamento do ambicioso RPG de ação…

34 minutos atrás

A Xiaomi lançou um dispositivo semelhante a um stick de TV com uma porta micro-USB e apenas 1 GB de RAM.

A Xiaomi lançou a segunda geração de seu compacto TV Stick HD, cujas especificações técnicas…

1 hora atrás

A Toshiba começou a enviar amostras de HDDs SMR de 3,5 polegadas com capacidade de 30 a 34 TB.

A Toshiba anunciou a série M12 de discos rígidos de 3,5 polegadas para provedores de…

1 hora atrás

Após sete anos de desenvolvimento e “centenas de milhões de dólares”, a Eidos Montreal cancelou o jogo AAAA que custou a vida ao novo Deus Ex.

Uma nova onda de demissões no estúdio canadense Eidos Montreal (Deus Ex: Mankind Divided, Shadow…

1 hora atrás

A Meta lançou os óculos inteligentes Ray-Ban Blayzer e Scriber com uma ampla seleção de lentes dióptricas.

Hoje, a Meta✴ anunciou o lançamento de dois óculos inteligentes Ray-Ban projetados para pessoas com…

2 horas atrás

Mais frames falsos: a Nvidia lança o DLSS 4.5 com o Gerador Dinâmico de Múltiplos Quadros (DMG) e o modo MFG 6X.

A Nvidia lançou o DLSS 4.5 Dynamic Multi-Frame Generation (DLSS 4.5) e o Multi-Frame Generation…

2 horas atrás