A Nvidia lançou um modelo de IA multimodal de código aberto e é tão bom quanto o GPT-4

A Nvidia introduziu uma nova família de grandes modelos de linguagem multimodal, NVLM 1.0, incluindo o NVLM-D-72B, treinado em 72 bilhões de parâmetros. Os modelos demonstram alto desempenho em uma ampla gama de tarefas, como visão computacional, geração de código, análise de imagens, resolução de problemas matemáticos e geração de texto. Parece que os líderes da indústria liderados pela OpenAI e pelo Google terão que abrir espaço.

Fonte da imagem: freepik.com

«”Estamos apresentando o NVLM 1.0, uma família de modelos multimodais de linguagem de ponta que alcançam resultados de última geração em tarefas de visão e linguagem, rivalizando com os principais modelos proprietários (como GPT-4o) e modelos de código aberto. “, disse Nvidia. Segundo eles, o código aberto dá aos pesquisadores e desenvolvedores acesso sem precedentes a tecnologias de ponta.

O modelo principal NVLM-D-72B demonstra adaptabilidade ao processar dados complexos de entrada visual e de texto. Os pesquisadores destacam a capacidade do modelo de interpretar memes, analisar imagens e resolver problemas matemáticos passo a passo. Os desenvolvedores também observaram que o NVLM-D-72B melhora seu desempenho em problemas com palavras após o treinamento multimodal, ao contrário da maioria dos modelos semelhantes.

O projeto NVLM também introduz soluções arquitetónicas inovadoras, incluindo uma abordagem híbrida que combina diferentes técnicas de processamento multimodal. Pesquisadores terceirizados dizem que o NVLM-D-72B está “no mesmo nível do Llama 3.1 405B em matemática e codificação, e tem visão”.

O lançamento do Nvidia NVLM 1.0 marca uma virada no desenvolvimento de IA. Ao abrir o código-fonte de um modelo que compete com gigantes proprietários, a Nvidia não está apenas compartilhando código – ela está desafiando a própria estrutura da indústria de IA. Graças à Nvidia, muitas organizações mais pequenas e investigadores independentes poderão fazer maiores contribuições para o desenvolvimento da IA, o que poderá inaugurar uma era de colaboração e inovação sem precedentes em IA.

Esta medida poderia desencadear uma reação em cadeia que forçaria outros líderes da IA ​​a abrirem também a sua investigação, acelerando potencialmente o progresso da IA ​​em todos os níveis.

Deve-se notar que o lançamento do NVLM 1.0 não é isento de riscos. À medida que a IA poderosa se torna mais acessível, também aumentam as preocupações sobre a sua utilização indevida e possíveis implicações éticas. A comunidade de IA já se depara com a necessidade de utilizar novas tecnologias de forma responsável.

Uma coisa é certa: as políticas de IA da Nvidia afetarão toda a indústria. A única questão é quão radical será o seu impacto e se os concorrentes conseguirão adaptar-se com rapidez suficiente para prosperar neste novo mundo de IA aberta.

avalanche

Postagens recentes

O Serviço Federal Antimonopólio verificará a legalidade da publicidade das operadoras sobre o 5G — “tecnologias que ainda não estão implementadas”.

O Serviço Federal Antimonopólio pretende analisar as promoções e a publicidade das operadoras de telecomunicações…

25 minutos atrás

Taiwan está considerando limitar o fornecimento de chips de IA para a China como parte de sistemas já finalizados.

Embora demonstre sua lealdade política geral aos Estados Unidos, Taiwan ainda não impôs restrições proporcionais…

44 minutos atrás

Os investidores estão prontos para comprar ações da SpaceX no valor de mais de US$ 250 bilhões, quatro vezes o valor da oferta.

Até recentemente, um aumento de duas vezes no número de pessoas dispostas a comprar ações…

3 horas atrás

A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software.

A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…

7 horas atrás

Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Segundo o Phoronix, a versão mais recente do driver gráfico Gallium3D R600, incluída no Mesa…

9 horas atrás