A empresa de Internet Amazon.com anunciou na quinta-feira que está transferindo algumas das operações de computação por trás de sua assistente de voz Alexa para seus próprios chips de design personalizado, abandonando os chips da NVIDIA. Espera-se que isso faça com que o serviço Alexa seja executado mais rapidamente e, ao mesmo tempo, reduza os custos da Amazon.
Quando os usuários de dispositivos como alto-falantes inteligentes da família Amazon Echo fazem uma pergunta ao assistente de voz, a solicitação é enviada a um dos datacenters da Amazon para processar e formar uma resposta. Essa resposta está em formato de texto e deve ser traduzida em uma fala audível que o assistente de voz dirá.
Anteriormente, todas essas operações eram feitas com chips NVIDIA, mas agora, segundo a Amazon, “a maior parte” desse processo será realizada usando seu próprio chip de computação Inferentia. O chip Amazon, anunciado pela primeira vez em 2018, é projetado especificamente para acelerar tarefas de aprendizado de máquina em grande escala, como texto para voz ou reconhecimento de imagem.
Proprietários de serviços de computação em nuvem como Amazon, Microsoft e Google se tornaram alguns dos maiores consumidores de chips de computação de IA para seus data centers, levando a um boom nas vendas de soluções especializadas da Intel, NVIDIA e outros. Mas as grandes empresas de tecnologia estão cada vez mais abandonando os fornecedores tradicionais de semicondutores para desenvolver seus próprios processadores. A Apple, que anunciou seus primeiros computadores Mac com seu próprio processador M1 com arquitetura Arm, pode ser colocada na mesma linha, tendo recusado os serviços da Intel.
A Amazon disse que a mudança para um chip Infertia para lidar com algumas de suas operações de processamento de consultas Alexa resultou em uma diminuição de 25% na latência, enquanto reduziu os custos em 30%.
A empresa também disse que seu serviço de reconhecimento facial baseado em nuvem Rekognition também começou a lançar chips Inferentia. No entanto, ela não especificou quais chips eram usados anteriormente pelo serviço de reconhecimento facial e quanto das operações foram transferidas para seus próprios chips.