Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Gemini AI não é tão bom no processamento de grandes quantidades de dados como o Google afirma

Uma nova pesquisa lança dúvidas sobre as afirmações do Google de que os grandes modelos de linguagem do Gemini são capazes de processar grandes volumes de dados, mostrando que são significativamente menos eficazes na análise de textos e vídeos longos.

Fonte da imagem: Google

Estudos recentes revelaram deficiências significativas no trabalho dos principais modelos de inteligência artificial generativa do Google, Gemini 1.5 Pro e 1.5 Flash, escreve o TechCrunch. O Google destacou repetidamente a capacidade do Gemini de processar grandes quantidades de dados graças à sua grande janela de contexto, dizendo que seus modelos podem analisar documentos com centenas de páginas e procurar informações em gravações de vídeo. No entanto, dois estudos independentes demonstraram que, na prática, estes modelos lidam muito pior com tais tarefas.

Cientistas da UMass Amherst, do Instituto Allen de IA e da Universidade de Princeton testaram o Gemini quanto à sua capacidade de responder a perguntas sobre o conteúdo de livros de ficção. O livro submetido para a prova continha aproximadamente 260 mil palavras (cerca de 520 páginas). Os resultados foram decepcionantes. O Gemini 1.5 Pro respondeu corretamente apenas 46,7% das vezes e o Gemini 1.5 Flash apenas 20% das vezes. Calculando ainda mais a média dos resultados, descobriu-se que nenhum dos modelos foi capaz de obter precisão ao responder perguntas acima do acaso.

Marzena Karpinska, coautora do estudo, observou: “Embora modelos como o Gemini 1.5 Pro possam tecnicamente lidar com contextos longos, vimos muitos casos indicando que os modelos não entendem realmente o conteúdo”.

O segundo estudo, conduzido por cientistas da Universidade da Califórnia, em Santa Bárbara, focou na capacidade do Gemini 1.5 Flash de analisar conteúdo de vídeo, especificamente slides de imagens. Os resultados também se mostraram insatisfatórios – de 25 imagens, a IA deu respostas corretas apenas em metade dos casos e, com o aumento do número de imagens, a precisão das respostas caiu para 30%, o que lança dúvida sobre a eficácia do modelo no trabalho com dados multimídia.

Porém, nota-se que nenhum dos estudos passou pelo processo de revisão por pares e, além disso, as versões mais recentes dos modelos com contexto de 2 milhões de tokens não foram testadas. No entanto, as descobertas levantam sérias questões sobre as capacidades reais dos modelos generativos de IA em geral e a validade das afirmações de marketing dos gigantes da tecnologia.

A pesquisa surge em meio ao crescente ceticismo em relação à IA generativa. Assim, pesquisas recentes da empresa de consultoria internacional Boston Consulting Group mostraram que cerca de metade dos executivos seniores entrevistados não esperam um aumento significativo na produtividade com o uso de IA generativa e estão preocupados com possíveis erros e problemas de segurança de dados.

Os especialistas apelam ao desenvolvimento de critérios mais objetivos para avaliar as capacidades da IA e a uma maior atenção e críticas independentes. O Google ainda não comentou os resultados desses estudos.

avalanche

Próximo A Epic Games apresentou um pedido à Apple para devolver Fortnite ao iOS e lançar sua própria loja de aplicativos na UE »

Anterior « Os criadores de Guilty Gear e BlazBlue traçaram um rumo para a Europa - Arc System Works abriu um escritório em Paris

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Notícias e análises financeiras

Michael Burry prevê um colapso das ações de tecnologia, semelhante à bolha das empresas ponto-com.

O especialista em investimentos Michael Burry, famoso pelo filme "A Grande Aposta", alertou que o…

21 minutos atrás

Notícias da rede

O eBay rejeitou a oferta de aquisição de US$ 56 bilhões da GameStop, considerando-a “pouco confiável e pouco atraente”.

A administração do eBay rejeitou uma oferta de aquisição de US$ 56 bilhões da varejista…

1 hora atrás

Redes e comunicações

“Ouvidos nas Paredes”: Cabos de fibra óptica foram adaptados para interceptar conversas próximas.

A tecnologia de sensoriamento acústico distribuído (DAS, na sigla em inglês) pode usar cabos de…

1 hora atrás

Notícias da rede

União Europeia vai intensificar medidas contra TikTok e Instagram por design “viciante”

A presidente da Comissão Europeia (CE), Ursula von der Leyen, afirmou na Cúpula Europeia sobre…

1 hora atrás

Até 64 TB de RAM: HPE apresenta o servidor modular de computação escalável 3250.

A HPE anunciou o servidor Compute Scale-up 3250, baseado em hardware Intel, para cargas de…

2 horas atrás

Redes sociais

O TikTok contesta seu status de “guardião” na mais alta corte da Europa.

A administração do TikTok lançou sua mais recente tentativa de contestar seu status de "guardião"…

2 horas atrás

Gemini AI não é tão bom no processamento de grandes quantidades de dados como o Google afirma

Conteúdo relacionado

Postagens recentes

Michael Burry prevê um colapso das ações de tecnologia, semelhante à bolha das empresas ponto-com.

O eBay rejeitou a oferta de aquisição de US$ 56 bilhões da GameStop, considerando-a “pouco confiável e pouco atraente”.

“Ouvidos nas Paredes”: Cabos de fibra óptica foram adaptados para interceptar conversas próximas.

União Europeia vai intensificar medidas contra TikTok e Instagram por design “viciante”

Até 64 TB de RAM: HPE apresenta o servidor modular de computação escalável 3250.

O TikTok contesta seu status de “guardião” na mais alta corte da Europa.