A LG introduziu a rede neural Captioning AI, que cria descrições de texto para imagens

Uma divisão da LG introduziu o Captioning AI, um sistema generativo de IA capaz de reconhecer elementos de imagem e gerar descrições e palavras-chave para eles – é difícil superestimar os benefícios que essa tecnologia pode proporcionar, por exemplo, na organização de bancos de dados de imagens de grandes empresas.

Talvez nem todas as imagens sejam fáceis de descrever. Fonte da imagem: Rick Rothenberg/unsplash.com

O desenvolvedor de legendas AI LG AI Research falou na Computer Vision and Pattern Recognition 2023, a maior conferência de “visão computacional” do mundo, realizada no domingo em Vancouver, Canadá. De acordo com a LG, o serviço é baseado na tecnologia Zero-shot Image Captioning desenvolvida pela LG AI Research, que permite que a IA “entenda” e descreva objetos ou cenas que a rede neural avalia pela primeira vez sem prompts adicionais, com base em sua experiência anterior – assim como as pessoas.

A empresa explicou que a tecnologia é diferente de serviços de IA como o Midjourney, nos quais tudo acontece exatamente ao contrário – os usuários inserem texto ou fazem upload de uma imagem, com base na qual a IA gera sua própria criação. Criar “legendas” para fotos pode parecer bem fácil, já que o conceito não é novo. No entanto, a tecnologia atingiu um novo nível. Por exemplo, a inteligência artificial pode realmente tirar conclusões e descrever algo que nunca “viu” antes – olhar para uma paisagem ou uma pessoa e descobrir que lugar é. A tecnologia permite reconhecer o fundo, os personagens e até mesmo a atividade na imagem e descrever a interação dos elementos.

Fonte da imagem: LG

A Caption AI pode gerar descrições de texto e palavras-chave para 10.000 imagens em menos de dois dias, o que, em teoria, poderia melhorar a eficiência e a produtividade de empresas que precisam gerenciar grandes matrizes de imagens. Em média, o sistema pode gerar 5 frases e 10 palavras-chave em 10 segundos.

O serviço foi desenvolvido em colaboração com a Shutterstock, uma das maiores plataformas de postagem de conteúdo visual – de imagens a vídeos. A LG AI Research já colaborou com esta empresa americana no passado e pretende continuar a expandir a cooperação com outros parceiros. De acordo com a Shutterstock, a tecnologia Caption AI está evoluindo por meio de “acesso antecipado” ao programa de dez clientes globais.

avalanche

Postagens recentes

A Electronic Arts fez sua previsão sobre quem vencerá a Copa do Mundo da FIFA de 2026, repetindo o feito dos quatro vencedores anteriores.

Embora a Electronic Arts tenha perdido sua licença oficial para a Copa do Mundo da…

52 minutos atrás

Apresentado o Logitech Mobi Fold: Mouse dobrável com rolagem por toque e carregamento rápido.

A Logitech anunciou o Mobi Fold, um mouse dobrável projetado para uso em movimento. Ele…

1 hora atrás

A Índia questionou a segurança da Starlink e adiou seu lançamento no país.

A rede de comunicações via satélite Starlink possui tal cobertura e velocidades de transmissão de…

1 hora atrás

Monumento do Triunfo: Fãs derrubaram os servidores de Destiny 2 durante o lançamento da última atualização em protesto contra o fim do suporte.

Os fãs do jogo de tiro online gratuito Destiny 2, da Bungie, empresa pertencente à…

2 horas atrás

O chefe de IA da Microsoft criticou a Anthropic por tentar atribuir lampejos de consciência a Claude.

Mustafa Suleyman, chefe de IA da Microsoft, classificou as tentativas da Anthropic de sugerir que…

2 horas atrás

A SkyDrive planeja lançar táxis voadores nos céus do Japão em 2028.

O pequeno setor de aviação elétrica atraiu um número significativo de startups, e a japonesa…

2 horas atrás