A Microsoft AI revelou três modelos de IA próprios para geração de texto, voz e imagens.

A divisão de pesquisa em IA da Microsoft revelou três novos modelos de inteligência artificial (IA) capazes de gerar texto, voz e imagens. Em uma disputa acirrada com os principais laboratórios de IA, a empresa decidiu fortalecer sua posição alavancando sua própria infraestrutura multimodal.

Fonte da imagem: xAI

O modelo MAI-Transcribe-1 converte fala em texto em 25 idiomas, superando o serviço Azure Fast em 2,5 vezes. O segundo modelo, MAI-Voice-1, cria uma faixa de áudio de um minuto em um segundo e suporta personalização de voz. O MAI-Image-2 gera conteúdo visual a partir de descrições de texto.

De acordo com o TechCrunch, o projeto foi liderado pela equipe MAI Superintelligence, que realiza pesquisas fundamentais em sistemas avançados de IA, e foi liderado por Mustafa Suleyman, diretor executivo da equipe, em novembro de 2025.

Neste projeto, os desenvolvedores se concentraram em reduzir os custos de computação em comparação com projetos semelhantes do Google e da OpenAI. O preço da transcrição de texto começa em US$ 0,36 por hora, a síntese de fala custa US$ 22 por 1 milhão de caracteres e o processamento de imagens custa US$ 5 por 1 milhão de tokens de entrada e US$ 33 para gerar 1 milhão de tokens de saída. Todos os modelos já estão implementados na plataforma Microsoft Foundry, e os modelos de transcrição e síntese de fala também estão disponíveis no MAI Playground.

Apesar de lançar ativamente seus próprios desenvolvimentos, em entrevista à VentureBeat, Suleiman reafirmou seu compromisso com a parceria com a OpenAI, na qual a Microsoft já investiu mais de US$ 13 bilhões. A empresa continuará usando os modelos da OpenAI em seus produtos sob um contrato plurianual, seguindo a mesma estratégia de diversificação adotada em seu negócio de microchips.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O Google começou a implementar agentes de busca com IA, mas, por enquanto, apenas para usuários pagos.

Em sua conferência de maio, o Google apresentou uma nova tecnologia: mecanismos de busca com…

30 minutos atrás

A Netgear acusou a subsidiária americana da TP-Link de manter laços estreitos com Pequim.

Nos Estados Unidos, continua a disputa judicial entre as fabricantes de roteadores Netgear e TP-Link…

30 minutos atrás

Cientistas criaram um neuroestimulador sem fio do tamanho de um grão de arroz — é fácil de inserir e suprime a dor.

Pesquisadores de Abu Dhabi desenvolveram um minúsculo dispositivo sem fio, aproximadamente do tamanho de um…

30 minutos atrás

Procuradores-gerais de vários estados dos EUA iniciaram investigações contra a OpenAI.

Uma coalizão de procuradores-gerais de vários estados americanos lançou uma investigação em larga escala contra…

2 horas atrás

Motoristas da Tesla aprenderam a enganar o piloto automático com uma cabeça de brinquedo para navegar nas redes sociais enquanto dirigem.

Na China, descobriram uma maneira de burlar o sistema de assistência ao condutor Full Self-Driving…

2 horas atrás

Os japoneses criaram um eletrolisador sem bateria para a síntese eficiente de combustível a partir de água, dióxido de carbono e luz solar.

Cientistas da Universidade Metropolitana de Osaka desenvolveram um sistema de fotossíntese artificial que converte luz…

2 horas atrás