O Ollama agora oferece suporte à aceleração de hardware em chips Apple M5 com 32 GB de memória.

O Ollama, um aplicativo desenvolvido para executar localmente modelos de inteligência artificial em computadores com Windows, macOS e Linux, agora oferece suporte à aceleração de hardware em sistemas com processadores Apple M5.

Fonte da imagem: ollama.com

Ao contrário de aplicativos baseados em nuvem, como o ChatGPT, cujos modelos não podem ser executados localmente e exigem uma conexão com a internet, o Ollama permite baixar e executar modelos de IA diretamente em computadores pessoais. Os modelos de código aberto são publicados em plataformas da comunidade ou enviados diretamente por desenvolvedores e podem ser baixados gratuitamente.

No entanto, executá-los localmente pode ser um desafio, já que os modelos de IA normalmente consomem grandes quantidades de RAM e memória de vídeo do sistema. Para superar esse problema, os desenvolvedores do aplicativo adicionaram suporte à estrutura de aprendizado de máquina MLX da Apple e à arquitetura de memória unificada no Ollama 0.19, aumentando seu desempenho em sistemas com chips da Apple.

Contudo, isso atualmente se aplica apenas aos chipsets mais recentes da Apple: M5, M5 Pro e M5 Max. O Ollama 0.19 aproveita os aceleradores de rede neural da plataforma, reduzindo o tempo para a primeira emissão de tokens e proporcionando maior velocidade geral de geração de tokens. Como resultado, tanto agentes de IA pessoais, como o OpenClaw, quanto agentes especializados, incluindo OpenCode, Anthropic Claude Code e OpenAI Codex, ficaram mais rápidos. Existe ainda outra limitação: o computador deve ter pelo menos 32 GB de memória unificada.

admin

Compartilhar
Publicado por
admin

Postagens recentes

“Esta é uma vitória para todo o ecossistema”: Qualcomm saúda a entrada da Nvidia no mercado de processadores para PCs.

Kedar Kondap, vice-presidente sênior de sistemas de computação da Qualcomm, comentou sobre a entrada da…

27 minutos atrás

Os processadores RTX Spark oferecerão suporte nativo a softwares anti-cheat e antipirataria para jogos.

Hoje, a Nvidia anunciou oficialmente o RTX Spark, uma nova plataforma para PCs com Windows…

40 minutos atrás

Calendário de lançamentos de 1 a 7 de junho: Gothic 1 Remake, Fatekeeper, Underchoice e The 7th Guest Remake

O verão começa com uma semana inesperadamente forte. A estrela do calendário é o tão…

53 minutos atrás

Após 10 anos em desenvolvimento, a próxima grande atualização será a última do Factorio.

Os desenvolvedores do estúdio independente tcheco Wube Software esclareceram seus planos para a próxima atualização…

1 hora atrás