Em outubro, a Apple, com o apoio de cientistas da Universidade Cornell, disponibilizou publicamente seu próprio modelo multimodal de linguagem grande, Ferret, que pode aceitar fragmentos de imagem como consultas.

Fonte da imagem: Laurenz Heymann/unsplash.com

O lançamento de Ferret no GitHub em outubro não foi acompanhado de grandes anúncios da Apple, mas o projeto posteriormente atraiu a participação de especialistas do setor. O princípio de funcionamento do Ferret é que o modelo estude um determinado fragmento da imagem, identifique os objetos nesta área e os contorne com uma moldura. O sistema percebe objetos reconhecidos em um fragmento de imagem como parte de uma solicitação, cuja resposta é fornecida em formato de texto. Por exemplo, um usuário pode destacar um animal em uma imagem e pedir que Ferret o reconheça. O modelo responderá a que espécie o animal pertence, e será possível fazer perguntas adicionais contextualizadas, esclarecendo informações sobre outros objetos ou ações.

Fonte da imagem: twitter.com/zhegan4

O modelo aberto de Ferret é um sistema que pode “referenciar e justificar qualquer coisa, em qualquer lugar, com qualquer detalhe”, explicou o pesquisador de IA da Apple, Zhe Gan. Especialistas do setor destacam a importância de lançar o projeto neste formato – demonstra a abertura de uma empresa tradicionalmente fechada. Segundo uma versão, a Apple decidiu dar esse passo porque busca competir com a Microsoft e o Google, mas não possui recursos computacionais comparáveis. Por conta disso, não pôde contar com o lançamento de seu próprio concorrente ao ChatGPT e foi obrigada a escolher entre fazer parceria com um hiperescalador de nuvem ou lançar o projeto em formato aberto, como a Meta✴ havia feito anteriormente.

avalanche

Postagens recentes

DuneCrawl – Uma Aventura Cavalgando como um Caranguejo. Resenha

Jogado no PC A equipe canadense Alientrap vem lançando jogos discretos há muitos anos —…

7 horas atrás

Considerando o custo, sim: a Tesla removeu o assistente de manutenção de faixa como opção gratuita na América do Norte.

Durante muito tempo, mesmo os compradores dos modelos Tesla mais baratos recebiam o recurso Autopilot…

23 horas atrás

Se este ano a receita com a venda de memórias crescer 134%, no próximo ano crescerá apenas 53%.

Especialistas da TrendForce calcularam que a receita com DRAM cresceu 73%, atingindo US$ 165,7 bilhões…

23 horas atrás

As ações da Intel despencaram 17% após a divulgação de seu relatório trimestral.

As revelações da administração da Intel em sua recente teleconferência de resultados trimestrais desagradaram os…

24 horas atrás

O Google Fotos lançou um recurso experimental que cria memes com inteligência artificial a partir de fotos dos usuários.

O aplicativo Google Fotos lançou um novo recurso chamado Me Meme, que usa inteligência artificial…

1 dia atrás

A Coreia do Sul ultrapassou a União Europeia: foi promulgada a primeira lei básica do mundo sobre inteligência artificial.

A Coreia do Sul tornou-se o primeiro país do mundo a introduzir um conjunto abrangente…

1 dia atrás