O chefe da Unidade de Inteligência Artificial do Microsoft Mustafa Suleyman (Mustafa Suleyman), em um esforço para fortalecer a posição da empresa no desenvolvimento de Jeenets interativos, expande a equipe da Microsoft, atrai os principais especialistas do Google, incluindo os criadores da tecnologia de visão geral do áudio. Os ex -colegas de Suleiman de DeepMind, de onde ele deixou em 2022, estarão envolvidos no projeto para criar modelos multimodais para processar texto, som e vídeo.

Fonte da imagem: Copiloto

De acordo com o Financial Times, entre os novos funcionários da Microsoft estavam Marco Tagliasacchi e Zalán Borsos, os criadores da função de visão geral do áudio, que permite transformar o texto no estilo de uma subcustral fascinante. Esses pesquisadores também participaram do desenvolvimento da Astra, o promissor II-Agent de DeepMind, capaz de responder a perguntas em tempo real usando vídeo, áudio e texto.

Matthias Minderer também se juntou à equipe. Ele estará envolvido no desenvolvimento de recursos de IA para analisar imagens. Todos os três funcionarão no novo Microsoft Research Center em Zurique e, de acordo com uma fonte familiarizada com a situação, desempenhará um papel fundamental no desenvolvimento da próxima geração copiloto, com base na qual os Jeenets interativos capazes de realizar uma ampla gama de tarefas serão criadas.

Em relação às perdas de pessoal desse nível, o Google Deepmind não fez comentários. No entanto, note -se que a transição desses especialistas do Google DeepMind para a Microsoft faz parte de uma luta feroz por talentos no campo da IA. Ao mesmo tempo, ambas as empresas continuam sendo participantes importantes no desenvolvimento de modelos multimodais de IA capazes de analisar e entender o conteúdo com base em áudio, vídeos ou imagens.

Contra essa corrida competitiva, outras empresas também não estão muito atrás – o OpenAI introduziu o modo de voz para o ChatGPT, a Amazon introduz a IA em seu assistente de voz Alexa. O Google também está se preparando para o lançamento do Astra Voice Agent em 2025.

avalanche

Postagens recentes

O driver mais recente da Intel irá acelerar os tempos de carregamento de jogos para algumas GPUs Arc.

A Intel lançou a versão 32.0.101.8626 WHQL do driver gráfico, que adiciona o recurso Graphics…

4 horas atrás

A Meta decidiu descontinuar o metaverso Horizon Worlds nos headsets de realidade virtual Quest, após pedidos de “fãs preocupados”.

Esta semana, a Meta✴Platforms anunciou que a plataforma de realidade virtual Horizon World seria descontinuada…

4 horas atrás

A Waymo gabou-se de que seus táxis autônomos percorreram mais de 270 milhões de quilômetros sem incidentes graves.

A Waymo anunciou que seus táxis autônomos percorreram mais de 270 milhões de quilômetros sem…

4 horas atrás

Cultivando a Inteligência Artificial Geral (IAG) em sua equipe / Inteligência Artificial

A busca por um gato preto em um quarto escuro (especialmente se for a versão…

5 horas atrás

A Xiaomi apresentou a próxima geração do carro elétrico SU7, com autonomia de até 902 km, LiDAR de série e, mais uma vez, mais barato que um Tesla.

A Xiaomi apresentou hoje oficialmente uma versão atualizada do veículo elétrico Xiaomi SU7, com uma…

6 horas atrás

O veículo explorador Perseverance descobriu um antigo delta de rio escondido sob a superfície de Marte.

Como é sabido, o rover Perseverance da NASA está explorando o delta de um antigo…

7 horas atrás