A Microsoft AI revelou três modelos de IA próprios para geração de texto, voz e imagens.

A divisão de pesquisa em IA da Microsoft revelou três novos modelos de inteligência artificial (IA) capazes de gerar texto, voz e imagens. Em uma disputa acirrada com os principais laboratórios de IA, a empresa decidiu fortalecer sua posição alavancando sua própria infraestrutura multimodal.

Fonte da imagem: xAI

O modelo MAI-Transcribe-1 converte fala em texto em 25 idiomas, superando o serviço Azure Fast em 2,5 vezes. O segundo modelo, MAI-Voice-1, cria uma faixa de áudio de um minuto em um segundo e suporta personalização de voz. O MAI-Image-2 gera conteúdo visual a partir de descrições de texto.

De acordo com o TechCrunch, o projeto foi liderado pela equipe MAI Superintelligence, que realiza pesquisas fundamentais em sistemas avançados de IA, e foi liderado por Mustafa Suleyman, diretor executivo da equipe, em novembro de 2025.

Neste projeto, os desenvolvedores se concentraram em reduzir os custos de computação em comparação com projetos semelhantes do Google e da OpenAI. O preço da transcrição de texto começa em US$ 0,36 por hora, a síntese de fala custa US$ 22 por 1 milhão de caracteres e o processamento de imagens custa US$ 5 por 1 milhão de tokens de entrada e US$ 33 para gerar 1 milhão de tokens de saída. Todos os modelos já estão implementados na plataforma Microsoft Foundry, e os modelos de transcrição e síntese de fala também estão disponíveis no MAI Playground.

Apesar de lançar ativamente seus próprios desenvolvimentos, em entrevista à VentureBeat, Suleiman reafirmou seu compromisso com a parceria com a OpenAI, na qual a Microsoft já investiu mais de US$ 13 bilhões. A empresa continuará usando os modelos da OpenAI em seus produtos sob um contrato plurianual, seguindo a mesma estratégia de diversificação adotada em seu negócio de microchips.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A startup de Jim Keller planeja colocar fábricas de chips em uma linha de montagem.

A Atomic Semi, fundada pelo renomado arquiteto de processadores Jim Keller e pelo engenheiro Sam…

2 horas atrás

A abundância de inteligência artificial continua a impulsionar a Foxconn, com a receita a subir quase 40% no segundo trimestre.

A Foxconn, empresa taiwanesa e maior fabricante mundial de eletrônicos sob contrato, registrou um aumento…

4 horas atrás

Um ex-engenheiro da Microsoft conseguiu fazer um motor Stirling funcionar usando o calor de um processador AMD Threadripper.

Dave Plummer, desenvolvedor veterano da Microsoft e criador de vários componentes essenciais do Windows, incluindo…

5 horas atrás

A Sony estava desenvolvendo um controle DualShock com o primeiro PlayStation integrado, mas o projeto foi cancelado.

Um ex-desenvolvedor da Sony apresentou um protótipo do console PlayStation Puga, que nunca chegou ao…

7 horas atrás

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

Os desenvolvedores de robôs humanoides estão ansiosos para demonstrar progressos significativos em seu desenvolvimento, mas,…

13 horas atrás