O desenvolvimento da IA ​​está sendo prejudicado por uma superabundância de dados inúteis — há dados demais.

A Fortune escreve que melhorias adicionais nos sistemas de IA, que permitirão a transição do ChatGPT para o uso de robôs humanoides, dependem da qualidade dos dados fornecidos a esses sistemas para treinamento.

Fonte da imagem: Igor Omilaev/unsplash.com

A publicação observou que a indústria está na iminência da próxima fronteira da IA ​​— IA física e modelos ambientais — sistemas que aprenderão e, em última instância, operarão no mundo físico. Para adquirirem as habilidades cognitivas necessárias para navegar em estradas, dobrar roupas ou auxiliar em cirurgias médicas complexas, eles precisam de mais do que apenas dados para download. Seu treinamento requer dados ricos e multifacetados. E, a menos que os pesquisadores consigam conter a superabundância de dados desnecessários — dados que não contribuem para o desenvolvimento de modelos —, todo o potencial da IA ​​física e dos modelos ambientais pode nunca ser alcançado.

O problema é que a criação de novos modelos de IA mais avançados exige cada vez mais dados. Surfando na onda do hype da IA, inúmeras startups de IA, como Scale AI, Surge AI e Mercor, surgiram, impulsionadas por um apetite insaciável por dados. No entanto, satisfazer essa necessidade resultou na criação de vastas quantidades de dados desnecessários que, na verdade, não contribuem para o desenvolvimento de modelos de IA, observou a Fortune.

Treinar modelos para compreender um mundo complexo e multidimensional exige muito mais dados — dados que também são muito difíceis de obter. Engenheiros de aprendizado de máquina recorrem à modelagem de dados, usando reconstruções virtuais de cenários do mundo real para criar dados para treinar robôs e carros autônomos.

Usar dados de baixa qualidade no treinamento de modelos de IA pode levar a resultados imprevisíveis. Como?A Fortune reportou que a OpenAI descontinuou o suporte ao aplicativo de vídeo Sora devido a um problema de dados, já que seu modelo do mundo não possuía uma compreensão suficiente da física, dificultando a criação de previsões realistas.

Para o avanço da IA, os especialistas em aprendizado de máquina precisam de ferramentas e tecnologias para remover dados desnecessários, analisar, limpar, normalizar e corrigir os dados de treinamento. O sucesso do treinamento exigirá a extração de informações valiosas e a separação delas dos dados irrelevantes.

Atualmente, o fator limitante é a falta de dados de alta qualidade. As empresas que compreenderem isso primeiro criarão sistemas de IA que realmente funcionam, segundo a Fortune.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Os moscovitas ficarão sem internet móvel e serviços de SMS durante o feriado de maio.

Segundo informações do jornal Kommersant, que cita fontes confiáveis ​​do mercado de telecomunicações, estão previstos…

38 minutos atrás

A MSI IPC lança o computador de placa única MS-CF27 de 3,5″ com quatro portas 2.5GbE.

A MSI IPC anunciou o computador de placa única (SBC) MS-CF27, construído sobre uma plataforma…

51 minutos atrás

GameStop oferece US$ 56 bilhões para comprar o eBay.

Ontem, a varejista de videogames GameStop propôs ao conselho de administração do eBay a venda…

2 horas atrás

As placas gráficas GeForce RTX 5050 e Radeon RX 9070 apareceram no ranking de hardware do Steam.

A Valve publicou novos dados sobre o hardware e o software usados ​​na plataforma Steam.…

2 horas atrás

Um reencontro muito aguardado: um modder adicionou um comerciante do remake de Resident Evil 4 a Resident Evil Requiem.

Os desenvolvedores do aclamado jogo de ação e terror Resident Evil Requiem trocaram os carismáticos…

2 horas atrás