As empresas de IA que gastaram milhares de milhões de dólares na construção de grandes modelos linguísticos (LLMs) estão agora a apostar em modelos linguísticos “pequenos” como uma nova fonte de crescimento de receitas, relata o Financial Times. Os custos de criação e treinamento de tais modelos de IA são muito mais baixos do que os dos LLMs.

Fonte da imagem: geralt/Pixabay

Apple, Microsoft, Meta✴ e Google lançaram recentemente novos modelos de IA com menos parâmetros, mas ainda com capacidades poderosas. Eles foram levados a tomar esta medida pelo alto custo do LLM, bem como pelas preocupações sobre o uso dos dados recolhidos para formação devido a uma possível violação de direitos autorais.

Empresas como Meta✴ e Google começaram a oferecer modelos de linguagem pequena com apenas alguns bilhões de parâmetros como uma alternativa mais barata, eficiente em termos de energia e personalizável aos modelos de linguagem grande. Além disso, esses modelos requerem menos energia para treinar e funcionar e podem proteger dados confidenciais.

«Ao ter tanta qualidade a um custo menor, você está, na verdade, dando aos clientes a capacidade de usar muito mais aplicativos e fazer coisas que eles achavam que não lhes dariam retorno suficiente sobre esse investimento (LLM) para justificar seu uso real. ” observou Eric Boyd, vice-presidente corporativo da Microsoft Azure AI Platform.

Google, Meta✴, Microsoft e a startup francesa Mistral também lançaram modelos de linguagem menores, mais ricos e mais orientados para tarefas.

Os modelos de linguagem pequena também têm a vantagem de poderem executar tarefas localmente no dispositivo sem enviar informações para a nuvem, o que atrairá clientes preocupados com a privacidade que não desejam enviar informações para fora das redes internas. Esses modelos também podem ser usados ​​em smartphones. Por exemplo, o modelo Gemini Nano do Google está instalado nos smartphones Pixel e Samsung S24. A Apple também deu a entender que está desenvolvendo modelos de IA para rodar em smartphones iPhone.

Por sua vez, o CEO da OpenAI, Sam Altman, disse que sua empresa continuará a trabalhar na criação de modelos maiores de IA com capacidades avançadas que possam raciocinar, planejar e executar tarefas, e que eventualmente serão capazes de atingir o mesmo nível de inteligência, como uma pessoa.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *