Categorias: Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

A Nvidia entra na batalha da inferência: um chip com tecnologia Groq está sendo desenvolvido para a OpenAI e agentes de IA.

Segundo o The Wall Street Journal, a Nvidia pretende lançar um novo processador projetado especificamente para ajudar a OpenAI e outros clientes a criar aplicativos mais rápidos e eficientes com base em modelos de IA treinados. Anteriormente, os produtos da empresa eram focados principalmente no treinamento de IA.

Fonte da imagem: nvidia.com

A Nvidia está desenvolvendo um novo sistema para inferência — executando modelos de IA à medida que respondem a consultas do usuário. A nova plataforma, que a empresa apresentará na conferência de desenvolvedores Nvidia GTC em março, incluirá um chip desenvolvido pela startup Groq. A competição nesse campo está se intensificando — Google e Amazon já criaram seus próprios aceleradores capazes de competir com os produtos da Nvidia. A situação é agravada pelo crescimento explosivo da programação intuitiva — a criação de software por sistemas de IA com base em consultas de texto do usuário.

A OpenAI já concordou em ser uma das maiores clientes do novo processador, segundo fontes, e isso representa uma grande vitória para a Nvidia. Um dia antes, a desenvolvedora do ChatGPT insinuou esse projeto ao anunciar um grande acordo para adquirir “capacidade de inferência dedicada” da Nvidia, bem como um investimento de US$ 30 bilhões da fabricante de telecomunicações. A empresa também assinou um acordo para usar os aceleradores de IA Amazon Trainium.

A Nvidia domina o mercado de unidades de processamento gráfico (GPUs) — chips capazes de executar bilhões de tarefas simples simultaneamente. Suas famílias de GPUs Hopper, Blackwell e Rubin são consideradas as melhores para treinamento de IA, e analistas estimam que a participação da empresa no mercado global seja de pelo menos 90%. O CEO Jensen Huang afirma que os produtos da Nvidia são igualmente adequados tanto para treinamento quanto para inferência. No entanto, desenvolvedores de agentes de IA e outros aplicativos baseados em IA estão começando a perceber que, em comparação com os designs da concorrência, os chips da Nvidia são muito caros, consomem muita energia e não são tão adequados para executar aplicativos já complexos.modelos treinados.

Em janeiro, a OpenAI firmou uma parceria com a startup Cerebras, oferecendo um chip focado em inferência que, segundo a empresa, é mais rápido que os aceleradores da Nvidia. A OpenAI iniciou as negociações com a Cerebras no outono passado, quando os engenheiros da empresa solicitaram hardware mais rápido para aplicações de codificação baseadas em agentes. No ano passado, a Nvidia fechou um acordo de US$ 20 bilhões com a startup Groq, licenciando sua tecnologia e contratando executivos de alto escalão, incluindo seu fundador. A Groq desenvolveu chips baseados em uma arquitetura fundamentalmente diferente, incorporando “unidades de processamento de linguagem” altamente eficientes para tarefas de inferência. Até o momento, a Nvidia não se pronunciou sobre suas intenções de utilizar esses recursos.

Uma das áreas mais demandadas em IA é a geração de código. O Anthropic Claude Code, que roda nas infraestruturas de nuvem da Amazon e do Google, é considerado líder nesse segmento, mas o OpenAI Codex, que rodará na nova infraestrutura da Nvidia, também está em desenvolvimento ativo. A Nvidia também firmou um acordo com a Meta✴ para sistemas de IA de inferência para segmentação de anúncios — uma tarefa que é realizada com maior eficiência em CPUs.

admin

Próximo As versões globais do Xiaomi 17, Xiaomi 17 Ultra e Xiaomi 17 Ultra Leica Edition foram apresentadas por € 2.000 — todas com baterias menores. »

Anterior « A Oppo e a Honor estão se preparando para lançar smartphones dobráveis com telas sem vincos – desta vez, ao que parece, para valer.

Deixar comentário

Publicado por

admin

3 meses atrás

Postagens recentes

Redes sociais

Os usuários do Instagram terão controle total sobre seus feeds com a ajuda da inteligência artificial.

O Instagram vai lançar um recurso chamado "Seu Algoritmo", que permitirá personalizar as recomendações no…

1 hora atrás

Notícias da rede

O YouTube agora oferece salas de bate-papo privadas para compartilhamento de vídeos com acesso somente por convite.

O YouTube começou a implementar um sistema de compartilhamento de conteúdo e mensagens privadas em…

1 hora atrás

Carros, motos, veículos

A GM encontrou uma alternativa mais econômica às baterias LFP de baixo custo para uso em veículos elétricos.

A influência das empresas chinesas CATL e BYD no mercado global de baterias de tração…

2 horas atrás

Processadores

A placa gráfica integrada de nível básico dos chips Intel Panther Lake mostrou-se 26% mais lenta que a AMD Radeon 840M.

O Notebookcheck testou a placa gráfica integrada mais fraca dos processadores Intel Panter Lake. A…

2 horas atrás

Notícias da rede

O Google começará a usar dados do Google Lens, Search Live e Tradutor para treinar inteligência artificial.

O Google anunciou mudanças na forma como armazena os dados do usuário relacionados a pesquisas…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Músicos estão processando o Google por usar suas músicas do YouTube para treinar seu modelo de IA Lyria.

Um grupo de músicos independentes que publicam suas músicas no YouTube entrou com um processo…

7 horas atrás