As empresas de IA que gastaram milhares de milhões de dólares na construção de grandes modelos linguísticos (LLMs) estão agora a apostar em modelos linguísticos “pequenos” como uma nova fonte de crescimento de receitas, relata o Financial Times. Os custos de criação e treinamento de tais modelos de IA são muito mais baixos do que os dos LLMs.
Fonte da imagem: geralt/Pixabay
Apple, Microsoft, Meta✴ e Google lançaram recentemente novos modelos de IA com menos parâmetros, mas ainda com capacidades poderosas. Eles foram levados a tomar esta medida pelo alto custo do LLM, bem como pelas preocupações sobre o uso dos dados recolhidos para formação devido a uma possível violação de direitos autorais.
Empresas como Meta✴ e Google começaram a oferecer modelos de linguagem pequena com apenas alguns bilhões de parâmetros como uma alternativa mais barata, eficiente em termos de energia e personalizável aos modelos de linguagem grande. Além disso, esses modelos requerem menos energia para treinar e funcionar e podem proteger dados confidenciais.
«Ao ter tanta qualidade a um custo menor, você está, na verdade, dando aos clientes a capacidade de usar muito mais aplicativos e fazer coisas que eles achavam que não lhes dariam retorno suficiente sobre esse investimento (LLM) para justificar seu uso real. ” observou Eric Boyd, vice-presidente corporativo da Microsoft Azure AI Platform.
Google, Meta✴, Microsoft e a startup francesa Mistral também lançaram modelos de linguagem menores, mais ricos e mais orientados para tarefas.
Os modelos de linguagem pequena também têm a vantagem de poderem executar tarefas localmente no dispositivo sem enviar informações para a nuvem, o que atrairá clientes preocupados com a privacidade que não desejam enviar informações para fora das redes internas. Esses modelos também podem ser usados em smartphones. Por exemplo, o modelo Gemini Nano do Google está instalado nos smartphones Pixel e Samsung S24. A Apple também deu a entender que está desenvolvendo modelos de IA para rodar em smartphones iPhone.
Por sua vez, o CEO da OpenAI, Sam Altman, disse que sua empresa continuará a trabalhar na criação de modelos maiores de IA com capacidades avançadas que possam raciocinar, planejar e executar tarefas, e que eventualmente serão capazes de atingir o mesmo nível de inteligência, como uma pessoa.
Juntamente com o smartphone Xiaomi 17 Ultra, a Xiaomi apresentou hoje os novos fones de…
Os desenvolvedores chineses alcançaram novos patamares na tecnologia de trens de levitação magnética (maglev). Um…
Ontem, surgiram relatos no Reddit de infecções por malware durante tentativas ilegais de ativação do…
Os desenvolvedores do estúdio americano Bungie, pertencente à Sony Interactive Entertainment, mostraram como os gráficos…
Em uma entrevista recente com o blogueiro Denis Korobkov do canal Welovegames na Twitch, o…
Calcular o pi tem sido, há muito tempo, uma forma de avaliar o desempenho do…