O Ollama agora oferece suporte à aceleração de hardware em chips Apple M5 com 32 GB de memória.

O Ollama, um aplicativo desenvolvido para executar localmente modelos de inteligência artificial em computadores com Windows, macOS e Linux, agora oferece suporte à aceleração de hardware em sistemas com processadores Apple M5.

Fonte da imagem: ollama.com

Ao contrário de aplicativos baseados em nuvem, como o ChatGPT, cujos modelos não podem ser executados localmente e exigem uma conexão com a internet, o Ollama permite baixar e executar modelos de IA diretamente em computadores pessoais. Os modelos de código aberto são publicados em plataformas da comunidade ou enviados diretamente por desenvolvedores e podem ser baixados gratuitamente.

No entanto, executá-los localmente pode ser um desafio, já que os modelos de IA normalmente consomem grandes quantidades de RAM e memória de vídeo do sistema. Para superar esse problema, os desenvolvedores do aplicativo adicionaram suporte à estrutura de aprendizado de máquina MLX da Apple e à arquitetura de memória unificada no Ollama 0.19, aumentando seu desempenho em sistemas com chips da Apple.

Contudo, isso atualmente se aplica apenas aos chipsets mais recentes da Apple: M5, M5 Pro e M5 Max. O Ollama 0.19 aproveita os aceleradores de rede neural da plataforma, reduzindo o tempo para a primeira emissão de tokens e proporcionando maior velocidade geral de geração de tokens. Como resultado, tanto agentes de IA pessoais, como o OpenClaw, quanto agentes especializados, incluindo OpenCode, Anthropic Claude Code e OpenAI Codex, ficaram mais rápidos. Existe ainda outra limitação: o computador deve ter pelo menos 32 GB de memória unificada.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Meta✴ está preparando racks de IA de cinco toneladas com chips da AMD.

O Open Compute Project (OCP) lançou a especificação de rack de servidor Open Rack Wide…

1 hora atrás

A xAI está perdendo popularidade, mas Elon Musk ainda pode trazer a startup de volta à disputa.

Representantes da OpenAI estão convencidos de que as ações judiciais de Elon Musk visam fortalecer…

1 hora atrás

O escândalo de pirataria de servidores de IA da Supermicro não afetou seus relacionamentos com a AMD, NVIDIA e Intel.

A Supermicro divulgou seus resultados do terceiro trimestre fiscal de 2026, encerrado em 31 de…

2 horas atrás

A TSMC está disposta a investir até US$ 250 bilhões em um parque tecnológico no Arizona, mas enfrenta diversos desafios.

Implementado inicialmente sob pressão das autoridades americanas, o projeto para estabelecer uma fábrica de chips…

2 horas atrás

Os desenvolvedores de Forza Horizon 6 “recompensaram” os piratas com uma proibição pelos próximos 8.000 anos.

Os desenvolvedores do estúdio britânico Playground Games, pertencente ao Xbox, responderam a um vazamento do…

2 horas atrás

A Microsoft não poderá lucrar mais de US$ 38 bilhões com sua colaboração com a OpenAI.

A Microsoft é a investidora estratégica mais antiga da OpenAI, tendo investido pelo menos US$…

3 horas atrás