A empresa de Internet Amazon.com anunciou na quinta-feira que está transferindo algumas das operações de computação por trás de sua assistente de voz Alexa para seus próprios chips de design personalizado, abandonando os chips da NVIDIA. Espera-se que isso faça com que o serviço Alexa seja executado mais rapidamente e, ao mesmo tempo, reduza os custos da Amazon.
REUTERS / Elijah Novo
Quando os usuários de dispositivos como alto-falantes inteligentes da família Amazon Echo fazem uma pergunta ao assistente de voz, a solicitação é enviada a um dos datacenters da Amazon para processar e formar uma resposta. Essa resposta está em formato de texto e deve ser traduzida em uma fala audível que o assistente de voz dirá.
Anteriormente, todas essas operações eram feitas com chips NVIDIA, mas agora, segundo a Amazon, “a maior parte” desse processo será realizada usando seu próprio chip de computação Inferentia. O chip Amazon, anunciado pela primeira vez em 2018, é projetado especificamente para acelerar tarefas de aprendizado de máquina em grande escala, como texto para voz ou reconhecimento de imagem.
Proprietários de serviços de computação em nuvem como Amazon, Microsoft e Google se tornaram alguns dos maiores consumidores de chips de computação de IA para seus data centers, levando a um boom nas vendas de soluções especializadas da Intel, NVIDIA e outros. Mas as grandes empresas de tecnologia estão cada vez mais abandonando os fornecedores tradicionais de semicondutores para desenvolver seus próprios processadores. A Apple, que anunciou seus primeiros computadores Mac com seu próprio processador M1 com arquitetura Arm, pode ser colocada na mesma linha, tendo recusado os serviços da Intel.
A Amazon disse que a mudança para um chip Infertia para lidar com algumas de suas operações de processamento de consultas Alexa resultou em uma diminuição de 25% na latência, enquanto reduziu os custos em 30%.
A empresa também disse que seu serviço de reconhecimento facial baseado em nuvem Rekognition também começou a lançar chips Inferentia. No entanto, ela não especificou quais chips eram usados anteriormente pelo serviço de reconhecimento facial e quanto das operações foram transferidas para seus próprios chips.
As aplicações industriais dos robôs humanoides chineses não se limitarão ao mercado interno, conforme revelado…
Pesquisadores da Universidade de Nova Gales do Sul (UNSW) desenvolveram um tipo fundamentalmente novo de…
Em meados do verão passado, a OpenAI concluiu a aquisição da startup de Jony Ive…
O jogo de aventura Tides of Tomorrow, publicado pela THQ Nordic e desenvolvido pela Digixart…
Na semana passada, o aplicativo Google Clock foi atualizado para a versão 8.5. O desenvolvedor…
O Yandex Maps adicionou a capacidade de compartilhar sua localização em tempo real, permitindo que…