Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Google apresenta Gemma 2 2B, um modelo de linguagem compacto que supera o GPT 3.5 Turbo

O Google revelou o Gemma 2 2B, um modelo de linguagem de inteligência artificial (LLM) compacto, mas poderoso, que pode competir com os líderes do setor, apesar de seu tamanho significativamente menor. Com apenas 2,6 bilhões de parâmetros, o novo modelo de linguagem oferece desempenho equivalente a concorrentes muito maiores, incluindo OpenAI GPT-3.5 e Mistral AI Mixtral 8x7B.

Fonte da imagem: Google

No teste LMSYS Chatbot Arena, uma popular plataforma online para benchmarking e avaliação da qualidade de modelos de inteligência artificial, o Gemma 2 2B obteve 1.130 pontos. Este resultado está um pouco à frente dos resultados do GPT-3.5-Turbo-0613 (1117 pontos) e Mixtral-8x7B (1114 pontos) – modelos com dez vezes mais parâmetros.

O Google diz que Gemma 2 2B também obteve pontuação de 56,1 no teste MMLU (Massive Multitask Language Understanding) e 36,6 no teste MBPP (Mostly Basic Python Programming), o que é uma melhoria significativa em relação à versão anterior.

Gemma 2 2B desafia a sabedoria convencional de que modelos de linguagem maiores têm um desempenho inerentemente melhor do que os menores. O desempenho do Gemma 2 2B mostra que métodos de treinamento sofisticados, eficiência arquitetônica e conjuntos de dados de alta qualidade podem compensar a falta de parâmetros. O desenvolvimento do Gemma 2 2B também destaca a crescente importância das técnicas de compressão e destilação de modelos de IA. A capacidade de compilar com eficiência informações de modelos maiores em modelos menores abre as portas para ferramentas de IA mais acessíveis, sem sacrificar o desempenho.

O Google treinou Gemma 2 2B em um enorme conjunto de dados de 2 trilhões de tokens usando sistemas alimentados por seus aceleradores proprietários de IA TPU v5e. O suporte a vários idiomas amplia seu potencial de uso em aplicações globais. O modelo Gemma 2 2B é de código aberto. Pesquisadores e desenvolvedores podem acessar o modelo por meio da plataforma Hugging Face. Ele também oferece suporte a várias estruturas, incluindo PyTorch e TensorFlow.

avalanche

Próximo A Microsoft reconhece oficialmente a OpenAI como concorrente na área de IA e tecnologias de pesquisa »

Anterior « O relatório da Meta dá esperança de que os enormes gastos das grandes tecnologias em IA compensarão

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A AMD revelou como executar agentes de IA diretamente em um PC com placas gráficas Ryzen ou Radeon — tudo o que você precisa são 128 GB de RAM.

A AMD publicou um guia sobre como executar o agente de IA de código aberto…

1 hora atrás

Computadores e laptops Apple

O iFixit desmontou o MacBook Neo e o considerou o laptop da Apple mais fácil de reparar.

Os especialistas do iFixit desmontaram o novo MacBook Neo e ficaram agradavelmente surpresos com a…

2 horas atrás

Gráficos 3D

Styx: Blades of Greed – As mesmas piadas de goblins de sempre. Análise / Jogos

Nove anos atrás, concluí minha análise do segundo jogo do Styx com as palavras: "Shards…

2 horas atrás

O mundo da robótica

Styx: Blades of Greed – As mesmas piadas de goblins de sempre. Resenha

Há nove anos, concluí minha análise do segundo jogo do Styx com as palavras: "Shards…

2 horas atrás

Gráficos 3D

A Nvidia promete acelerar o ray tracing e o path tracing em um milhão de vezes em futuras GPUs.

Apesar da crescente concorrência da Intel e da AMD, a linha de placas gráficas RTX…

3 horas atrás

Sistemas de refrigeração

Foi introduzida uma nova geração de blocos de água para IA, capazes de resfriar toda a placa simultaneamente.

Essencialmente, os aceleradores de IA mais avançados estão refrigerando sistemas de refrigeração líquida obsoletos. É…

3 horas atrás

Google apresenta Gemma 2 2B, um modelo de linguagem compacto que supera o GPT 3.5 Turbo

Conteúdo relacionado

Postagens recentes

A AMD revelou como executar agentes de IA diretamente em um PC com placas gráficas Ryzen ou Radeon — tudo o que você precisa são 128 GB de RAM.

O iFixit desmontou o MacBook Neo e o considerou o laptop da Apple mais fácil de reparar.

Styx: Blades of Greed – As mesmas piadas de goblins de sempre. Análise / Jogos

Styx: Blades of Greed – As mesmas piadas de goblins de sempre. Resenha

A Nvidia promete acelerar o ray tracing e o path tracing em um milhão de vezes em futuras GPUs.

Foi introduzida uma nova geração de blocos de água para IA, capazes de resfriar toda a placa simultaneamente.