Pesquisadores AI2 se unem à AMD e outros para criar uma rede neural científica

O Paul Allen Institute for Artificial Intelligence (AI2) planeja lançar um grande Modelo de Linguagem Aberta (OLMo) focado em pesquisa em 2024. O OLMo está sendo desenvolvido em parceria com a AMD, o consórcio Large Unified Modern Infrastructure, que fornece poder de supercomputação para treinamento e educação, e Surge AI e MosaicML, que fornecem dados e código de treinamento.

Fonte da imagem: pixabay

Hanna Hajishirzi, diretora sênior de pesquisa neurolinguística (PNL) da AI2, afirmou que “as comunidades de pesquisa e tecnologia precisam de acesso a modelos de linguagem aberta para o avanço da ciência. Com o OLMo, estamos trabalhando para preencher a lacuna entre as capacidades e conhecimentos de pesquisa pública e privada, construindo um modelo de linguagem competitivo.” De acordo com Khadzhishirzi, embora muitos modelos de código aberto tenham trazido novas experiências e até “ultrapassado os limites”, eles não foram especificamente direcionados.

O AI2 vê o OLMo como uma plataforma, não apenas outro modelo de IA e, de acordo com Hadjishirzi, tudo o que o AI2 fizer para o OLMo será público, incluindo o conjunto de dados e a API. Outra diferença com o OLMo, de acordo com Noah Smith, diretor sênior de pesquisa em PNL da AI2, é permitir que o modelo use e entenda melhor livros didáticos e trabalhos acadêmicos. Observe que esta não é a primeira tentativa de fazer uma rede neural científica. Por exemplo, o infame Galactica da Meta*. No entanto, Hajishirzi acredita que ensinar AI2 na academia e ferramentas desenvolvidas por cientistas para pesquisa, como o Semantic Scholar, ajudará a tornar o OLMo “exclusivamente adequado” para aplicações científicas e acadêmicas.

O treinamento deve começar nos próximos meses no supercomputador LUMI na Finlândia, o supercomputador mais rápido da Europa a partir de janeiro. O AI2 convida os funcionários a ajudar a fornecer informações e avaliar criticamente o processo de desenvolvimento do modelo. Os interessados ​​podem entrar em contato com os organizadores na página do projeto OLMo.

* Está incluída no rol de associações públicas e entidades religiosas em relação às quais o tribunal tenha proferido decisão que entrou em vigor para liquidar ou proibir atividades com base na Lei Federal nº 114-FZ, de 25 de julho de 2002 “Sobre o combate à atividade extremista”.

avalanche

Postagens recentes

SUBSTITUÍDO – Amor e Ódio em Phenix City. Crítica

Intel Core i5-8400 2.8 GHz / AMD Ryzen 5 2600 3.4 GHz, 16 GB de…

49 minutos atrás

SUBSTITUÍDO — Amor e Ódio em Phenix City. Análise / Jogos

Intel Core i5-8400 2.8 GHz / AMD Ryzen 5 2600 3.4 GHz, 16 GB de…

1 hora atrás

A ASRock apresenta o poderoso sistema de refrigeração líquida WS 360D para processadores AMD Threadripper e Intel Xeon W.

A ASRock lançou no Japão os sistemas de refrigeração WS TR 360D, que não necessitam…

2 horas atrás

Um britânico construiu uma motocicleta movida a vapor que se tornou a segunda moto mais rápida do mundo.

No evento Festival of Power, na vila britânica de Podington, Bedfordshire, na pista de aceleração…

4 horas atrás

Astrônomos observaram, pela primeira vez, uma explosão de supernova inexplicável, o que exige uma nova teoria.

Astrônomos podem ter descoberto um novo tipo de explosão cósmica, apelidada de "superkilonova". Este evento,…

7 horas atrás

Um entusiasta de hardware modificou a VBIOS de uma placa gráfica S3 antiga para tornar o preto verdadeiramente preto.

Um criador de conteúdo do canal do YouTube Bits und Bolts descobriu uma falha em…

7 horas atrás