Em outubro, a Apple, com o apoio de cientistas da Universidade Cornell, disponibilizou publicamente seu próprio modelo multimodal de linguagem grande, Ferret, que pode aceitar fragmentos de imagem como consultas.

Fonte da imagem: Laurenz Heymann/unsplash.com

O lançamento de Ferret no GitHub em outubro não foi acompanhado de grandes anúncios da Apple, mas o projeto posteriormente atraiu a participação de especialistas do setor. O princípio de funcionamento do Ferret é que o modelo estude um determinado fragmento da imagem, identifique os objetos nesta área e os contorne com uma moldura. O sistema percebe objetos reconhecidos em um fragmento de imagem como parte de uma solicitação, cuja resposta é fornecida em formato de texto. Por exemplo, um usuário pode destacar um animal em uma imagem e pedir que Ferret o reconheça. O modelo responderá a que espécie o animal pertence, e será possível fazer perguntas adicionais contextualizadas, esclarecendo informações sobre outros objetos ou ações.

Fonte da imagem: twitter.com/zhegan4

O modelo aberto de Ferret é um sistema que pode “referenciar e justificar qualquer coisa, em qualquer lugar, com qualquer detalhe”, explicou o pesquisador de IA da Apple, Zhe Gan. Especialistas do setor destacam a importância de lançar o projeto neste formato – demonstra a abertura de uma empresa tradicionalmente fechada. Segundo uma versão, a Apple decidiu dar esse passo porque busca competir com a Microsoft e o Google, mas não possui recursos computacionais comparáveis. Por conta disso, não pôde contar com o lançamento de seu próprio concorrente ao ChatGPT e foi obrigada a escolher entre fazer parceria com um hiperescalador de nuvem ou lançar o projeto em formato aberto, como a Meta✴ havia feito anteriormente.

avalanche

Postagens recentes

O Mercedes-Benz Classe C totalmente elétrico, com autonomia de 762 km, foi apresentado.

As oscilações da Mercedes-Benz no posicionamento de seus veículos elétricos levaram gradualmente à sua integração…

2 horas atrás

A nostalgia está em alta: o jogo de tiro retrô noir Mouse: P.I. For Hire teve um início “extremamente bem-sucedido” e agradou a editora com as vendas.

A PlaySide Publishing anunciou o sucesso inicial do jogo de tiro retrô com temática jazzística…

2 horas atrás

O terremoto de magnitude 7,7 no Japão causou os maiores danos à produção de produtos químicos para a fabricação de chips.

Assim como Taiwan, o Japão está localizado em uma área sismicamente vulnerável, portanto a concentração…

3 horas atrás

“Caramba, isso parece incrível”: Imagens vazadas do trailer “Assincronizado” de Assassin’s Creed Black Flag impressionaram os fãs.

Assim que a Ubisoft, desenvolvedora e editora francesa, confirmou a data de anúncio oficial de…

3 horas atrás

O laboratório de IA de Jeff Bezos está se preparando para captar US$ 10 bilhões em financiamento.

Elon Musk não esconde suas ambições em IA, não apenas fundindo a startup xAI em…

3 horas atrás

A Meta✴ oferecerá treinamento gratuito em redes de fibra óptica para americanos, ajudando-os a implantar rapidamente seus centros de dados com IA.

A Meta✴ anunciou o lançamento de um programa gratuito de quatro semanas, o LevelUp Fiber…

11 horas atrás