A Etched foi fundada há dois anos por dois graduados de Harvard com o objetivo de desenvolver um acelerador de IA especializado. Os chips gravados são únicos porque suportam apenas um tipo de modelo de IA: Transformadores. Esta arquitetura, proposta por uma equipe de pesquisadores do Google em 2017, tornou-se a arquitetura de IA generativa dominante atualmente.
O chip Sohu, desenvolvido pela Etched, é um circuito integrado de aplicação específica (ASIC) fabricado no processo de 4 nm da TSMC. De acordo com o CEO da empresa, Gavin Uberti, o novo chip pode oferecer desempenho de inferência significativamente melhor do que GPUs e outros chips de IA de uso geral, consumindo menos energia.
«Sohu é muito mais rápido e barato do que a próxima geração de GPUs Nvidia Blackwell GB200 ao executar conversores de texto, imagem e vídeo, diz Uberti. – Um servidor Sohu substitui 160 GPUs H100. Sohu será uma opção mais acessível, eficiente e ecologicamente correta para líderes empresariais que precisam de chips personalizados.”
Os especialistas sugerem que o Etched poderia alcançar resultados semelhantes usando um pipeline de saída de hardware-software otimizado para transformadores. Isso permitiu que os desenvolvedores eliminassem componentes de hardware necessários para suportar outras plataformas e reduzissem a sobrecarga de software.
Etched chega a um ponto de inflexão na corrida por estruturas generativas de IA. Além dos altos custos iniciais de hardware, os aceleradores de computação consomem enormes quantidades de eletricidade e recursos hídricos. Até 2030, prevê-se que o boom da IA aumente a procura de eletricidade para centros de dados em 160%, contribuindo para um aumento significativo nas emissões de gases com efeito de estufa. Até 2027, os data centers necessitarão de até 6,5 milhões de metros cúbicos de água doce para resfriar os servidores.
«Nossos futuros clientes não poderão deixar de mudar para Sohu”, está confiante Uberti. “As empresas estão dispostas a apostar no Etched porque a velocidade e o custo são críticos para os produtos de IA que estão tentando construir.” Os investidores parecem otimistas – a Etched arrecadou US$ 125,36 milhões em financiamento até o momento.
A empresa afirma que clientes não identificados já comprometeram “dezenas de milhões de dólares” para comprar seus chips, e o próximo lançamento do Sohu Developer Cloud permitirá que eles visualizem os recursos do Sohu em um mercado on-line interativo.
É muito cedo para dizer se isso será suficiente para impulsionar a Etched e sua equipe de 35 pessoas para o futuro que seus fundadores imaginaram. Basta lembrar os fracassos de startups semelhantes, como Mythic e Graphcore, e prestar atenção ao declínio geral no investimento em empresas de chips de IA em 2023.
«Em 2022 apostamos que os Transformers vão dominar o mundo”, afirmou Uberti. “Chegamos a um ponto na evolução da inteligência artificial em que chips especializados que podem funcionar melhor do que GPUs de uso geral são inevitáveis – e os tomadores de decisões tecnológicas em todo o mundo sabem disso.”
A empresa atualmente não tem concorrentes diretos, embora a startup de chips AI Perceive tenha anunciado recentemente um processador acelerado por hardware para Transformers, e a Groq tenha investido pesadamente na otimização de seus ASICs para modelos específicos.