Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

AMD lança seu primeiro modelo pequeno de linguagem AI – AMD-135M

À medida que a AMD tenta aumentar a sua presença no mercado de IA, a fabricante não só produz hardware para essas necessidades, como também decidiu desenvolver modelos de linguagem. O resultado disso foi o anúncio do primeiro AMD-135M de linguagem pequena.

Fonte da imagem: AMD

O novo modelo de linguagem pequena AMD-135M pertence à família Llama e destina-se à implantação em empresas privadas. Não está claro se o novo modelo de IA da AMD tem algo a ver com a recente aquisição da startup Silo AI pela empresa (o acordo ainda não foi finalizado e ainda não foi aprovado por vários reguladores, então provavelmente não). No entanto, este é um passo claro para atender às necessidades específicas do cliente com um modelo pré-treinado construído pela AMD usando seu próprio hardware.

A vantagem do modelo de linguagem da AMD é que ele usa o que é chamado de decodificação especulativa. O último é um “modelo de rascunho” menor que gera vários tokens candidatos em uma passagem direta. Os tokens são então passados para um “modelo alvo” maior e mais preciso que os valida ou corrige. Por um lado, esta abordagem permite gerar vários tokens simultaneamente, mas por outro lado, isso leva ao aumento do consumo de energia devido ao aumento da transferência de dados.

O modelo de linguagem AMD vem em duas versões: código AMD-Llama-135M e AMD-Llama-135M. Cada um deles é otimizado para tarefas específicas, aumentando o desempenho de inferência usando tecnologia de decodificação especulativa. O modelo básico AMD-Llama-135M foi treinado do zero usando 670 bilhões de tokens de dados compartilhados. Esse processo levou seis dias usando quatro nós de 8 canais baseados no AMD Instinct MI250.

O modelo de código AMD-Llama-135M, por sua vez, foi aprimorado devido ao treinamento adicional baseado em 20 bilhões de tokens adicionais focados especificamente na escrita de código de programa. O treinamento adicional do modelo levou quatro dias usando o mesmo conjunto de hardware AMD. A empresa acredita que otimizações adicionais dos seus modelos poderão levar a melhorias adicionais no seu desempenho e eficiência.

avalanche

Próximo O iPhone 16 se tornou o smartphone da Apple mais reparável da história »

Anterior « A Samsung desenvolveu uma bateria de estado sólido para o Galaxy Watch: é espaçosa, menor e mais segura que a de íon de lítio

Deixar comentário

Publicado por

avalanche

1 ano atrás

Postagens recentes

Eventos e eventos da indústria de TI, exposições, fóruns

O próximo Google I/O será realizado entre 19 e 20 de maio, com anúncios esperados sobre Gemini, Android e muito mais.

O Google anunciou que sua conferência anual para desenvolvedores, o Google I/O, acontecerá de 19…

2 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

Algo de Luxo: Dreame Apresenta o Smartphone de Luxo Aurora em Ouro e Pedras Preciosas

Após apresentar câmeras de ação inteligentes em formato de anel, a Dreame, famosa por seus…

3 horas atrás

Eletrônica vestível

Siri será treinada para “enxergar” o mundo: a Apple está acelerando o desenvolvimento de óculos, um pingente e AirPods com câmeras integradas.

A Apple acelerou o desenvolvimento de três novos dispositivos vestíveis como parte de sua transição…

3 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

A Tecno apresentou os smartphones Camon 50 e 50 Pro com chipsets Helio G200, câmeras de 50 megapixels e baterias de 6150 mAh.

O lançamento global dos smartphones Tecno Camon 50 está agendado para o MWC 2026, no…

3 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Menos alucinações e um milhão de contextos: a Anthropic lançou Sonnet 4.6, e agora está disponível gratuitamente em Claude.

A Anthropic atualizou seu modelo de linguagem de nível intermediário, o Sonnet. No anúncio do…

4 horas atrás

Jogos

A Activision confirmou a data de encerramento do Call of Duty: Warzone Mobile – o jogo será desativado apenas dois anos após o seu lançamento.

O jogo battle royale gratuito Call of Duty: Warzone Mobile para dispositivos iOS e Android…

5 horas atrás

AMD lança seu primeiro modelo pequeno de linguagem AI – AMD-135M

Conteúdo relacionado

Postagens recentes

O próximo Google I/O será realizado entre 19 e 20 de maio, com anúncios esperados sobre Gemini, Android e muito mais.

Algo de Luxo: Dreame Apresenta o Smartphone de Luxo Aurora em Ouro e Pedras Preciosas

Siri será treinada para “enxergar” o mundo: a Apple está acelerando o desenvolvimento de óculos, um pingente e AirPods com câmeras integradas.

A Tecno apresentou os smartphones Camon 50 e 50 Pro com chipsets Helio G200, câmeras de 50 megapixels e baterias de 6150 mAh.

Menos alucinações e um milhão de contextos: a Anthropic lançou Sonnet 4.6, e agora está disponível gratuitamente em Claude.

A Activision confirmou a data de encerramento do Call of Duty: Warzone Mobile – o jogo será desativado apenas dois anos após o seu lançamento.