Meta oferece colaboração da Amazon e da Microsoft para treinar modelos de IA de lhamas

A Meta✴ já investiu milhões de dólares na criação e no desenvolvimento de modelos de IA de código aberto na família Llama, mas treinar grandes LLMs está se tornando cada vez mais caro. Então, como relata o The Information, a Meta✴ pediu ajuda aos seus “colegas”, Microsoft e Amazon, o que é bastante estranho, já que a própria Meta✴ possui enormes recursos de computação.

Quatro fontes disseram que a Meta✴ ofereceu a essas empresas algum tipo de “incentivo”, como a capacidade de influenciar o desenvolvimento de futuros modelos de IA Llama. Não está totalmente claro qual é o benefício para a Microsoft e a Amazon neste caso, já que elas próprias estão trabalhando em projetos de IA, principalmente comerciais, enquanto a Meta✴ ganha principalmente com publicidade. Além disso, o Llama é um projeto de código aberto, então patrocinar a criação de um concorrente forte no mercado não é muito lucrativo.

Além das discussões “mais sérias” com a Amazon e a Microsoft, também foram realizadas conversas com a Databricks, IBM, Oracle e representantes de pelo menos um investidor do Oriente Médio, de acordo com pelo menos duas fontes. Meta✴ também está em discussões com empresas para formar o grupo Llama Consortium no início de 2025. Durante as discussões, ela teria pedido principalmente dinheiro, bem como servidores ou outros recursos que compensassem o custo de treinamento dos modelos.

Fonte da imagem: Juan Camilo Guarin P/unsplash.com

Outras formas de apoio a potenciais parceiros também foram discutidas. Por exemplo, representantes seniores da Meta✴ poderiam participar de conferências de parceiros ou fornecer informações mais detalhadas sobre o processo de treinamento do modelo. Os resultados finais das negociações não foram publicados, mas em um futuro próximo provavelmente será possível rastrear em quais eventos dos concorrentes os representantes da Meta✴ participarão ativamente.

Em novembro de 2024, foi relatado que mais de 100.000 aceleradores NVIDIA H100 foram usados ​​para treinar o então novo modelo Llama-4. E em março, a NVIDIA anunciou modelos de IA Llama Nemotron com “nível de inteligência” ajustável com base nas soluções Meta✴.

avalanche

Postagens recentes

“Senti que estava desmoronando”: Os desenvolvedores principais de Suicide Squad: Kill the Justice League quase abandonaram a indústria após o fracasso do jogo.

O fracasso do jogo de ação cooperativo da Rocksteady Studios, Suicide Squad: Kill the Justice…

1 hora atrás

OxygenOS e Realme UI serão relegados ao passado – OnePlus e Realme migrarão para o ColorOS.

O OxygenOS e a Realme UI não serão mais usados ​​nos novos modelos de smartphones…

2 horas atrás

IFixit criará um padrão unificado para a reparabilidade de eletrônicos nos EUA.

A iFixit, em parceria com a NSF, organização global independente de serviços, iniciou o desenvolvimento…

2 horas atrás

A Epic Games Store revelou os planos da Square Enix para expansões da história de Final Fantasy VII Revelation.

Embora a editora Square Enix já tenha dividido o remake do cultuado RPG japonês Final…

3 horas atrás

Cyberpunk 2077 vendeu mais de 40 milhões de cópias nos cinco anos e meio desde o seu lançamento.

As vendas de Cyberpunk 2077 ultrapassaram 40 milhões de cópias, anunciaram os desenvolvedores do RPG…

3 horas atrás

A Alibaba proibiu seus funcionários de usar o assistente de programação Claude Code, da Anthropic.

Após a American Anthropic acusar a Alibaba, da China, de extrair, ou efetivamente roubar, dados…

3 horas atrás