A Microsoft AI revelou três modelos de IA próprios para geração de texto, voz e imagens.

A divisão de pesquisa em IA da Microsoft revelou três novos modelos de inteligência artificial (IA) capazes de gerar texto, voz e imagens. Em uma disputa acirrada com os principais laboratórios de IA, a empresa decidiu fortalecer sua posição alavancando sua própria infraestrutura multimodal.

Fonte da imagem: xAI

O modelo MAI-Transcribe-1 converte fala em texto em 25 idiomas, superando o serviço Azure Fast em 2,5 vezes. O segundo modelo, MAI-Voice-1, cria uma faixa de áudio de um minuto em um segundo e suporta personalização de voz. O MAI-Image-2 gera conteúdo visual a partir de descrições de texto.

De acordo com o TechCrunch, o projeto foi liderado pela equipe MAI Superintelligence, que realiza pesquisas fundamentais em sistemas avançados de IA, e foi liderado por Mustafa Suleyman, diretor executivo da equipe, em novembro de 2025.

Neste projeto, os desenvolvedores se concentraram em reduzir os custos de computação em comparação com projetos semelhantes do Google e da OpenAI. O preço da transcrição de texto começa em US$ 0,36 por hora, a síntese de fala custa US$ 22 por 1 milhão de caracteres e o processamento de imagens custa US$ 5 por 1 milhão de tokens de entrada e US$ 33 para gerar 1 milhão de tokens de saída. Todos os modelos já estão implementados na plataforma Microsoft Foundry, e os modelos de transcrição e síntese de fala também estão disponíveis no MAI Playground.

Apesar de lançar ativamente seus próprios desenvolvimentos, em entrevista à VentureBeat, Suleiman reafirmou seu compromisso com a parceria com a OpenAI, na qual a Microsoft já investiu mais de US$ 13 bilhões. A empresa continuará usando os modelos da OpenAI em seus produtos sob um contrato plurianual, seguindo a mesma estratégia de diversificação adotada em seu negócio de microchips.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O Caminho Óctuplo para a IAG: Do Falso Nirvana ao Verdadeiro Nirvana / Inteligência Artificial

Qualquer pessoa não budista que tenha ao menos vagamente ouvido falar desse antigo ensinamento sabe…

1 hora atrás

Piratas derrotam Denuvo: jogos agora podem ser crackeados no dia do lançamento, mas desenvolvedora promete novas medidas.

Nas últimas semanas, uma parte significativa da internet dedicada a jogos e pirataria foi tomada…

2 horas atrás

A SpaceX reclamou que os lançamentos dos satélites concorrentes da Amazon, o Amazon Leo, criavam risco de colisão.

Embora a SpaceX tenha lançado os satélites Leo da Amazon em órbita em três das…

2 horas atrás

A 8BitDo lançou o teclado mecânico Retro 68 AP50, com preço de US$ 500, no estilo do computador Apple II.

A fabricante de periféricos para computador 8BitDo decidiu celebrar o 50º aniversário da Apple à…

2 horas atrás