Categorias: Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

A Nvidia entra na batalha da inferência: um chip com tecnologia Groq está sendo desenvolvido para a OpenAI e agentes de IA.

Segundo o The Wall Street Journal, a Nvidia pretende lançar um novo processador projetado especificamente para ajudar a OpenAI e outros clientes a criar aplicativos mais rápidos e eficientes com base em modelos de IA treinados. Anteriormente, os produtos da empresa eram focados principalmente no treinamento de IA.

Fonte da imagem: nvidia.com

A Nvidia está desenvolvendo um novo sistema para inferência — executando modelos de IA à medida que respondem a consultas do usuário. A nova plataforma, que a empresa apresentará na conferência de desenvolvedores Nvidia GTC em março, incluirá um chip desenvolvido pela startup Groq. A competição nesse campo está se intensificando — Google e Amazon já criaram seus próprios aceleradores capazes de competir com os produtos da Nvidia. A situação é agravada pelo crescimento explosivo da programação intuitiva — a criação de software por sistemas de IA com base em consultas de texto do usuário.

A OpenAI já concordou em ser uma das maiores clientes do novo processador, segundo fontes, e isso representa uma grande vitória para a Nvidia. Um dia antes, a desenvolvedora do ChatGPT insinuou esse projeto ao anunciar um grande acordo para adquirir “capacidade de inferência dedicada” da Nvidia, bem como um investimento de US$ 30 bilhões da fabricante de telecomunicações. A empresa também assinou um acordo para usar os aceleradores de IA Amazon Trainium.

A Nvidia domina o mercado de unidades de processamento gráfico (GPUs) — chips capazes de executar bilhões de tarefas simples simultaneamente. Suas famílias de GPUs Hopper, Blackwell e Rubin são consideradas as melhores para treinamento de IA, e analistas estimam que a participação da empresa no mercado global seja de pelo menos 90%. O CEO Jensen Huang afirma que os produtos da Nvidia são igualmente adequados tanto para treinamento quanto para inferência. No entanto, desenvolvedores de agentes de IA e outros aplicativos baseados em IA estão começando a perceber que, em comparação com os designs da concorrência, os chips da Nvidia são muito caros, consomem muita energia e não são tão adequados para executar aplicativos já complexos.modelos treinados.

Em janeiro, a OpenAI firmou uma parceria com a startup Cerebras, oferecendo um chip focado em inferência que, segundo a empresa, é mais rápido que os aceleradores da Nvidia. A OpenAI iniciou as negociações com a Cerebras no outono passado, quando os engenheiros da empresa solicitaram hardware mais rápido para aplicações de codificação baseadas em agentes. No ano passado, a Nvidia fechou um acordo de US$ 20 bilhões com a startup Groq, licenciando sua tecnologia e contratando executivos de alto escalão, incluindo seu fundador. A Groq desenvolveu chips baseados em uma arquitetura fundamentalmente diferente, incorporando “unidades de processamento de linguagem” altamente eficientes para tarefas de inferência. Até o momento, a Nvidia não se pronunciou sobre suas intenções de utilizar esses recursos.

Uma das áreas mais demandadas em IA é a geração de código. O Anthropic Claude Code, que roda nas infraestruturas de nuvem da Amazon e do Google, é considerado líder nesse segmento, mas o OpenAI Codex, que rodará na nova infraestrutura da Nvidia, também está em desenvolvimento ativo. A Nvidia também firmou um acordo com a Meta✴ para sistemas de IA de inferência para segmentação de anúncios — uma tarefa que é realizada com maior eficiência em CPUs.

admin

Próximo As versões globais do Xiaomi 17, Xiaomi 17 Ultra e Xiaomi 17 Ultra Leica Edition foram apresentadas por € 2.000 — todas com baterias menores. »

Anterior « A Oppo e a Honor estão se preparando para lançar smartphones dobráveis com telas sem vincos – desta vez, ao que parece, para valer.

Deixar comentário

Publicado por

admin

1 mês atrás

Postagens recentes

Jogos

Fontes internas: Sete anos após o êxodo do metrô, o novo metrô está finalmente pronto para ser anunciado.

Já se passaram mais de sete anos desde o lançamento de Metro Exodus, e o…

1 hora atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Pesquisadores utilizaram inteligência artificial para transformar um smartwatch comum em um sistema preciso de rastreamento de mãos.

Cientistas da Universidade Cornell e do Instituto Avançado de Ciência e Tecnologia da Coreia (KAIST)…

2 horas atrás

Carros, motos, veículos

“Não é um jogo. É uma carreira”: O governo dos EUA convidou jogadores profissionais para se tornarem controladores de tráfego aéreo na vida real.

A Administração Federal de Aviação (FAA) e o Departamento de Transportes dos EUA lançaram hoje…

2 horas atrás

Jogos

Resident Evil Requiem tornou-se o primeiro jogo com Denuvo de 2026 a ser totalmente pirateado.

Graças a uma solução alternativa ao Denuvo baseada em hipervisor, o jogo de ação e…

3 horas atrás

Jogos

A página do Rust 2 apareceu no Steam, mas os desenvolvedores não têm nada a ver com isso.

O simulador de sobrevivência multiplayer Rust, do estúdio britânico Facepunch Studios, continua popular mesmo 12…

4 horas atrás

Placas de vídeo

O poderoso Battlemage foi finalmente revelado em fotos: um vídeo de desmontagem da placa gráfica Intel Arc Pro B70 foi divulgado online.

O processador gráfico Big Battlemage da Intel, de maior porte, foi finalmente revelado em detalhes.…

5 horas atrás