A Nvidia lançou um modelo de IA multimodal de código aberto e é tão bom quanto o GPT-4

A Nvidia introduziu uma nova família de grandes modelos de linguagem multimodal, NVLM 1.0, incluindo o NVLM-D-72B, treinado em 72 bilhões de parâmetros. Os modelos demonstram alto desempenho em uma ampla gama de tarefas, como visão computacional, geração de código, análise de imagens, resolução de problemas matemáticos e geração de texto. Parece que os líderes da indústria liderados pela OpenAI e pelo Google terão que abrir espaço.

Fonte da imagem: freepik.com

«”Estamos apresentando o NVLM 1.0, uma família de modelos multimodais de linguagem de ponta que alcançam resultados de última geração em tarefas de visão e linguagem, rivalizando com os principais modelos proprietários (como GPT-4o) e modelos de código aberto. “, disse Nvidia. Segundo eles, o código aberto dá aos pesquisadores e desenvolvedores acesso sem precedentes a tecnologias de ponta.

O modelo principal NVLM-D-72B demonstra adaptabilidade ao processar dados complexos de entrada visual e de texto. Os pesquisadores destacam a capacidade do modelo de interpretar memes, analisar imagens e resolver problemas matemáticos passo a passo. Os desenvolvedores também observaram que o NVLM-D-72B melhora seu desempenho em problemas com palavras após o treinamento multimodal, ao contrário da maioria dos modelos semelhantes.

O projeto NVLM também introduz soluções arquitetónicas inovadoras, incluindo uma abordagem híbrida que combina diferentes técnicas de processamento multimodal. Pesquisadores terceirizados dizem que o NVLM-D-72B está “no mesmo nível do Llama 3.1 405B em matemática e codificação, e tem visão”.

O lançamento do Nvidia NVLM 1.0 marca uma virada no desenvolvimento de IA. Ao abrir o código-fonte de um modelo que compete com gigantes proprietários, a Nvidia não está apenas compartilhando código – ela está desafiando a própria estrutura da indústria de IA. Graças à Nvidia, muitas organizações mais pequenas e investigadores independentes poderão fazer maiores contribuições para o desenvolvimento da IA, o que poderá inaugurar uma era de colaboração e inovação sem precedentes em IA.

Esta medida poderia desencadear uma reação em cadeia que forçaria outros líderes da IA ​​a abrirem também a sua investigação, acelerando potencialmente o progresso da IA ​​em todos os níveis.

Deve-se notar que o lançamento do NVLM 1.0 não é isento de riscos. À medida que a IA poderosa se torna mais acessível, também aumentam as preocupações sobre a sua utilização indevida e possíveis implicações éticas. A comunidade de IA já se depara com a necessidade de utilizar novas tecnologias de forma responsável.

Uma coisa é certa: as políticas de IA da Nvidia afetarão toda a indústria. A única questão é quão radical será o seu impacto e se os concorrentes conseguirão adaptar-se com rapidez suficiente para prosperar neste novo mundo de IA aberta.

avalanche

Postagens recentes

A Microsoft investigará o que está impedindo os desenvolvedores de lançar jogos no Xbox

A Microsoft está expandindo seu programa Xbox Research para obter feedback dos desenvolvedores de jogos…

1 hora atrás

Análise do HUAWEI MatePad Pro 12.2” PaperMatte: tablet com tela dupla

A Apple lançou o primeiro tablet com tela Tandem OLED de camada dupla este ano…

3 horas atrás

O diretor de Baldur’s Gate 3 sugeriu quando o próximo jogo de Larian será lançado, mas depois voltou atrás

O chefe da Larian Studios, Swen Vincke, durante a cerimônia SEA Game Awards 2024 e…

3 horas atrás

A Microsoft alertou que a atualização 24H2 do Windows 11 está causando problemas em alguns jogos

A Microsoft bloqueou a instalação da atualização do Windows 24H2 para alguns sistemas devido aos…

3 horas atrás

Os jogadores estão cada vez mais escolhendo jogos indie e não querem perder tempo em enormes mundos abertos

A indústria de jogos está cansada de projetos de grande escala. Pequenos jogos que economizam…

4 horas atrás