As empresas de IA que gastaram milhares de milhões de dólares na construção de grandes modelos linguísticos (LLMs) estão agora a apostar em modelos linguísticos “pequenos” como uma nova fonte de crescimento de receitas, relata o Financial Times. Os custos de criação e treinamento de tais modelos de IA são muito mais baixos do que os dos LLMs.
Apple, Microsoft, Meta✴ e Google lançaram recentemente novos modelos de IA com menos parâmetros, mas ainda com capacidades poderosas. Eles foram levados a tomar esta medida pelo alto custo do LLM, bem como pelas preocupações sobre o uso dos dados recolhidos para formação devido a uma possível violação de direitos autorais.
Empresas como Meta✴ e Google começaram a oferecer modelos de linguagem pequena com apenas alguns bilhões de parâmetros como uma alternativa mais barata, eficiente em termos de energia e personalizável aos modelos de linguagem grande. Além disso, esses modelos requerem menos energia para treinar e funcionar e podem proteger dados confidenciais.
«Ao ter tanta qualidade a um custo menor, você está, na verdade, dando aos clientes a capacidade de usar muito mais aplicativos e fazer coisas que eles achavam que não lhes dariam retorno suficiente sobre esse investimento (LLM) para justificar seu uso real. ” observou Eric Boyd, vice-presidente corporativo da Microsoft Azure AI Platform.
Google, Meta✴, Microsoft e a startup francesa Mistral também lançaram modelos de linguagem menores, mais ricos e mais orientados para tarefas.
Os modelos de linguagem pequena também têm a vantagem de poderem executar tarefas localmente no dispositivo sem enviar informações para a nuvem, o que atrairá clientes preocupados com a privacidade que não desejam enviar informações para fora das redes internas. Esses modelos também podem ser usados em smartphones. Por exemplo, o modelo Gemini Nano do Google está instalado nos smartphones Pixel e Samsung S24. A Apple também deu a entender que está desenvolvendo modelos de IA para rodar em smartphones iPhone.
Por sua vez, o CEO da OpenAI, Sam Altman, disse que sua empresa continuará a trabalhar na criação de modelos maiores de IA com capacidades avançadas que possam raciocinar, planejar e executar tarefas, e que eventualmente serão capazes de atingir o mesmo nível de inteligência, como uma pessoa.
400 dos 650 funcionários da CD Projekt Red já estão trabalhando no ambicioso RPG de…
A empresa americana xMEMS vem estimulando a imaginação há muitos anos com seus incomuns alto-falantes…
Em termos monetários, conforme observado num relatório divulgado esta semana pela associação industrial SIA, as…
No final de outubro, surgiu a informação de que a empresa chinesa Sophgo poderia ajudar…
O CEO da Meta✴, Mark Zuckerberg, autorizou pessoalmente a divisão Meta✴ responsável pelo desenvolvimento de…
Em 19 de janeiro, entra em vigor a proibição da continuidade da operação da plataforma…