Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Mistral AI consolidou sua posição no mercado de código aberto com o lançamento do Mistral 3.

A startup francesa de IA, Mistral AI, apresentou sua família de modelos de código aberto de última geração, a Mistral 3, consolidando sua posição como uma forte candidata à liderança no mercado de IA de código aberto, que oferece aos clientes corporativos diversas vantagens em relação às soluções de grandes empresas de tecnologia.

Fonte da imagem: Mistral AI

A família Mistral 3 consiste em 10 modelos, incluindo o Mistral Large 3, um modelo Mixture of Experts (MoE) de grande porte com pesos abertos, multimodal e multilíngue. Este é o modelo mais poderoso da empresa até o momento, treinado com 41 bilhões de parâmetros ativos e 675 bilhões de parâmetros compartilhados. A família também inclui nove modelos menores com recursos offline e totalmente personalizáveis, incluindo três modelos Mistral de alta densidade de última geração com 4, 8 e 3 bilhões de parâmetros.

Os modelos Mistral oferecem a melhor relação custo-benefício em sua categoria. Ao mesmo tempo, o Mistral Large 3 está entre os principais modelos de código aberto otimizados para instruções refinadas.

A empresa observou que todos os modelos são lançados sob a licença Apache 2.0, acrescentando que disponibilizar os modelos em código aberto em vários formatos compactados fortalece a comunidade de desenvolvedores e possibilita o poder da IA por meio da inteligência distribuída.

Segundo o TechCrunch, a Mistral, uma startup fundada por ex-funcionários da DeepMind e da Meta✴, tem apenas dois anos e já arrecadou aproximadamente US$ 2,7 bilhões em financiamento, com uma avaliação de mercado de US$ 13,7 bilhões. Esse valor é significativamente menor do que o de concorrentes como a OpenAI (que arrecadou US$ 57 bilhões e alcançou uma avaliação de US$ 500 bilhões) e a Anthropic (que arrecadou US$ 45 bilhões e alcançou uma avaliação de US$ 350 bilhões).

A Mistral argumenta que tamanho nem sempre significa melhor, especialmente para aplicações de IA em empresas.“Nossos clientes às vezes ficam satisfeitos em começar com um modelo [fechado] muito grande que não precisam personalizar… mas, depois de implementá-lo, percebem que é caro e lento.”Guillaume Lample, cofundador e diretor científico da Mistral, disse ao TechCrunch: “Eles nos procuram para ajustar modelos menores e, assim, solucionar melhor um problema específico”. Ele observou que a grande maioria dos casos de uso de IA empresarial pode ser atendida com modelos pequenos e ajustados.

Lample argumenta que, ao comparar modelos de código aberto com modelos de referência, nos quais estes apresentam desempenho significativamente inferior aos seus equivalentes de código fechado, os resultados podem ser enganosos. Ele observou que modelos maiores e de código fechado podem ter um desempenho melhor logo de início, mas os ganhos reais com o uso de modelos menores vêm do ajuste fino.

admin

Próximo Cientistas hackeiam IA com nonsense: rearranjos de palavras burlam filtros e confundem modelos da avalanche noticias. »

Anterior « A Índia fez concessões: o aplicativo governamental obrigatório ainda poderá ser removido dos smartphones.

Deixar comentário

Publicado por

admin

8 meses atrás

Postagens recentes

Erro: a AWS cobrou bilhões e trilhões de dólares dos clientes devido a problemas de faturamento

No dia 17 de julho, os clientes da nuvem AWS receberam por e-mail faturas preliminares…

38 minutos atrás

Jogos

DOOM: A Idade das Trevas – Revelações. Sem revelações. Análise

\nJogado no PC\n\nO DLC Revelations saiu com um histórico de informações extremamente difícil - os…

2 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

Vazamento confirma design e especificações do amplo smartphone dobrável Samsung Galaxy Z Fold8

\nO insider Evan Blass publicou imagens do Samsung Galaxy Z Fold8 poucos dias antes da…

3 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Pesquisadores descobriram um vírus ClickLock para macOS que rouba senhas e criptomoedas

\nEspecialistas do Group-IB descobriram um novo malware para macOS, chamado ClickLock, que encerra todos os…

3 horas atrás

Jogos

Na onda do sucesso: uma semana após o lançamento, as vendas de Assassin’s Creed Black Flag Resynced atingiram novos patamares

\nMais de uma semana se passou desde o lançamento do jogo de ação pirata em…

4 horas atrás

Jogos

Um americano foi preso sob suspeita de roubar criptomoedas por meio de um vírus escondido em jogos Steam.

O FBI prendeu Zyaire Dontaevious Zamarion Wilkins, de 21 anos, na Flórida, e o acusou…

5 horas atrás