Apple, Microsoft, Meta e Google se concentraram na criação de pequenos modelos de IA com recursos poderosos devido ao alto custo do LLM

As empresas de IA que gastaram milhares de milhões de dólares na construção de grandes modelos linguísticos (LLMs) estão agora a apostar em modelos linguísticos “pequenos” como uma nova fonte de crescimento de receitas, relata o Financial Times. Os custos de criação e treinamento de tais modelos de IA são muito mais baixos do que os dos LLMs.

Fonte da imagem: geralt/Pixabay

Apple, Microsoft, Meta✴ e Google lançaram recentemente novos modelos de IA com menos parâmetros, mas ainda com capacidades poderosas. Eles foram levados a tomar esta medida pelo alto custo do LLM, bem como pelas preocupações sobre o uso dos dados recolhidos para formação devido a uma possível violação de direitos autorais.

Empresas como Meta✴ e Google começaram a oferecer modelos de linguagem pequena com apenas alguns bilhões de parâmetros como uma alternativa mais barata, eficiente em termos de energia e personalizável aos modelos de linguagem grande. Além disso, esses modelos requerem menos energia para treinar e funcionar e podem proteger dados confidenciais.

«Ao ter tanta qualidade a um custo menor, você está, na verdade, dando aos clientes a capacidade de usar muito mais aplicativos e fazer coisas que eles achavam que não lhes dariam retorno suficiente sobre esse investimento (LLM) para justificar seu uso real. ” observou Eric Boyd, vice-presidente corporativo da Microsoft Azure AI Platform.

Google, Meta✴, Microsoft e a startup francesa Mistral também lançaram modelos de linguagem menores, mais ricos e mais orientados para tarefas.

Os modelos de linguagem pequena também têm a vantagem de poderem executar tarefas localmente no dispositivo sem enviar informações para a nuvem, o que atrairá clientes preocupados com a privacidade que não desejam enviar informações para fora das redes internas. Esses modelos também podem ser usados ​​em smartphones. Por exemplo, o modelo Gemini Nano do Google está instalado nos smartphones Pixel e Samsung S24. A Apple também deu a entender que está desenvolvendo modelos de IA para rodar em smartphones iPhone.

Por sua vez, o CEO da OpenAI, Sam Altman, disse que sua empresa continuará a trabalhar na criação de modelos maiores de IA com capacidades avançadas que possam raciocinar, planejar e executar tarefas, e que eventualmente serão capazes de atingir o mesmo nível de inteligência, como uma pessoa.

avalanche

Postagens recentes

Reddit irá reprimir os criadores de conteúdo de treinamento de IA

A administração da plataforma Reddit anunciou que atualizará as exceções para robôs (arquivo robots.txt), que…

5 dias atrás

O desenvolvedor do Robotaxi, Cruise, é chefiado por um ex-executivo do Xbox

Marc Whitten, um engenheiro e veterano da indústria de jogos que esteve na vanguarda do…

5 dias atrás

Em resposta a inúmeras reclamações, o primeiro patch para Elden Ring: Shadow of the Erdtree tornou os jogadores mais fortes

A editora Bandai Namco e os desenvolvedores do estúdio FromSoftware anunciaram o lançamento do primeiro…

5 dias atrás