Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Para treinar o modelo Google PaLM 2 AI, foram usados cinco vezes mais dados de texto do que no modelo anterior.

Anunciado na semana passada, o modelo de linguagem grande do Google PaLM 2 foi treinado em um volume cinco vezes maior que o do modelo 2022. Isso permite que a nova rede neural resolva tarefas mais complexas em programação, matemática e redação de textos, descobriram os jornalistas da CNBC.

Fonte da imagem: blog.google

O Google PaLM 2 foi treinado com 3,6 trilhões de tokens – esses elementos de treinamento de grandes modelos de linguagem ajudam as redes neurais a prever as próximas palavras em sequências. Os algoritmos de predição, por sua vez, permitem que grandes modelos de linguagem componham frases coerentes. Sua versão anterior, Google PaLM, lançada em 2022, foi treinada para 780 bilhões de tokens.

No último evento do Google I/O, a empresa demonstrou ativamente os recursos da inteligência artificial em sua integração em busca, e-mail, trabalho com documentos de texto e planilhas, mas não forneceu detalhes sobre a quantidade de dados de treinamento. Uma estratégia semelhante foi adotada pela OpenAI, que introduziu recentemente o GPT-4. As empresas explicam suas ações pela natureza competitiva dos negócios, e o público insiste em maior transparência em relação à IA.

O Google, no entanto, disse que o novo modelo acabou sendo menor que os anteriores, ou seja, a eficiência da tecnologia na execução de tarefas mais complexas aumentou. O PaLM 2, de acordo com os documentos internos da empresa, é treinado em 340 bilhões de parâmetros, enquanto a primeira versão tinha 540 bilhões deles – isso indica que a complexidade do modelo aumentou. A empresa confirmou que o PaLM 2 é treinado em 100 idiomas, permitindo a integração em 25 recursos e produtos do ecossistema Google, incluindo o chatbot experimental Bard.

O Google PaLM 2, de acordo com dados disponíveis publicamente, pode ser mais poderoso do que todos os modelos existentes. Para efeito de comparação, o Meta* LlaMA, anunciado em fevereiro, é treinado para 1,4 trilhão de tokens; A OpenAI, quando ainda compartilhava informações, relatou que o GPT-3 foi treinado em 300 bilhões de tokens; e o Google LaMDA, lançado há dois anos, foi treinado para 1,5 trilhão de tokens.

* Está incluída na lista de associações públicas e organizações religiosas em relação às quais o tribunal decidiu definitivamente liquidar ou proibir atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “No combate a extremistas atividade”.

avalanche

Próximo A Immersion processa a Valve por causa dos motores de vibração Steam Deck e Index VR »

Anterior « Carros da Volkswagen podem obter software da Huawei - empresas estão negociando

Deixar comentário

Publicado por

avalanche

3 anos atrás

Postagens recentes

A Ampera imprimiu em 3D um pequeno reator de tório para alimentar centros de dados.

A startup americana Ampera anunciou o desenvolvimento do primeiro módulo de reator nuclear impresso em…

5 horas atrás

Desenvolvimento e fabricação de eletrônicos

A Samsung pretende se tornar uma fabricante líder de chips de IA, incorporando as tecnologias Anthropic e Meta.

A Samsung Electronics está fortalecendo sua posição como um dos principais players no mercado de…

6 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Em junho, os gastos dos usuários com IA caíram 20% – será que a febre da IA está chegando ao fim?

Analistas registraram uma queda em uma das principais métricas do mercado de IA — o…

8 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

Os novos smartphones dobráveis da Samsung serão entre €100 e €280 mais caros do que seus antecessores.

Informações divulgadas online indicam que os novos produtos da Samsung serão muito mais caros na…

8 horas atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

A escassez de memória refletida nas estatísticas de junho do Steam

A Valve publicou os resultados de sua Pesquisa de Hardware e Software do Steam referente…

8 horas atrás

Espaço

Uma operação para resgatar o observatório espacial Swift da NASA, que está caindo na Terra, foi iniciada.

Em 3 de julho de 2026, às 20h36, horário local (11h36, horário de Moscou), uma…

8 horas atrás

Para treinar o modelo Google PaLM 2 AI, foram usados ​​cinco vezes mais dados de texto do que no modelo anterior.

Conteúdo relacionado

Postagens recentes

A Ampera imprimiu em 3D um pequeno reator de tório para alimentar centros de dados.

A Samsung pretende se tornar uma fabricante líder de chips de IA, incorporando as tecnologias Anthropic e Meta.

Em junho, os gastos dos usuários com IA caíram 20% – será que a febre da IA ​​está chegando ao fim?

Os novos smartphones dobráveis ​​da Samsung serão entre €100 e €280 mais caros do que seus antecessores.

A escassez de memória refletida nas estatísticas de junho do Steam

Uma operação para resgatar o observatório espacial Swift da NASA, que está caindo na Terra, foi iniciada.

Para treinar o modelo Google PaLM 2 AI, foram usados cinco vezes mais dados de texto do que no modelo anterior.

Em junho, os gastos dos usuários com IA caíram 20% – será que a febre da IA está chegando ao fim?

Os novos smartphones dobráveis da Samsung serão entre €100 e €280 mais caros do que seus antecessores.