Mistral AI revela ferramenta que transformará qualquer documento PDF em arquivo de texto para IA

A desenvolvedora de modelos de grandes linguagens (LLM) franceses, Mistral AI, anunciou o lançamento de uma nova API projetada para lidar com documentos PDF complexos. Mistral OCR é uma API de reconhecimento óptico de caracteres (OCR) que pode transformar qualquer documento PDF em um arquivo de texto para facilitar o processamento com algoritmos baseados em IA.

Fonte da imagem: Scott Graham / Unsplash

Os modelos de linguagem que impulsionam algoritmos generativos populares, como o ChatGPT da OpenAI, funcionam particularmente bem em texto bruto. Portanto, as empresas que pretendem introduzir seus próprios fluxos de trabalho de IA sabem da importância de armazenar e indexar os dados em um formato limpo para que essas informações possam ser reutilizadas no processamento dos algoritmos de IA.

Ao contrário de muitas APIs de OCR, o desenvolvimento da Mistral é uma API multimodal que pode reconhecer não apenas texto, mas também ilustrações e fotografias colocadas entre blocos de texto. A API OCR gera caixas delimitadoras em torno dos elementos gráficos detectados e os inclui na saída. Processar um documento PDF com o Mistral OCR resulta em texto formatado em Markdown, que os algoritmos de IA processam com mais eficiência.

Fonte da imagem: Mistral

«Ao longo dos anos, as organizações acumulam um grande número de documentos, geralmente em formato PDF ou slide, que não são acessíveis para processamento LLM, especialmente para sistemas RAG [Retrieval-Augmented Generation – uma técnica para obter e usar dados como contexto para algoritmos de IA generativa]. Com o Mistral OCR, nossos clientes podem transformar documentos complexos em conteúdo legível em todos os idiomas. “Este é um passo fundamental para a adoção generalizada de assistentes de IA em empresas que precisam simplificar o acesso a uma extensa documentação interna”, disse Guillaume Lample, cofundador e diretor científico da Mistral.

O Mistral OCR está disponível na plataforma própria da empresa, bem como na infraestrutura dos parceiros de nuvem da Mistral, como AWS, Azure, etc. Para empresas que trabalham com dados confidenciais ou sigilosos, a Mistral oferece uma versão de API para implantação local. A empresa disse que o Mistral OCR tem melhor desempenho do que APIs semelhantes do Google, Microsoft ou OpenAI. A empresa testou sua API em documentos PDF complexos, incluindo aqueles contendo expressões matemáticas, layouts complexos e tabelas.

avalanche

Postagens recentes

A Electronic Arts fez sua previsão sobre quem vencerá a Copa do Mundo da FIFA de 2026, repetindo o feito dos quatro vencedores anteriores.

Embora a Electronic Arts tenha perdido sua licença oficial para a Copa do Mundo da…

35 minutos atrás

Apresentado o Logitech Mobi Fold: Mouse dobrável com rolagem por toque e carregamento rápido.

A Logitech anunciou o Mobi Fold, um mouse dobrável projetado para uso em movimento. Ele…

1 hora atrás

A Índia questionou a segurança da Starlink e adiou seu lançamento no país.

A rede de comunicações via satélite Starlink possui tal cobertura e velocidades de transmissão de…

1 hora atrás

Monumento do Triunfo: Fãs derrubaram os servidores de Destiny 2 durante o lançamento da última atualização em protesto contra o fim do suporte.

Os fãs do jogo de tiro online gratuito Destiny 2, da Bungie, empresa pertencente à…

1 hora atrás

O chefe de IA da Microsoft criticou a Anthropic por tentar atribuir lampejos de consciência a Claude.

Mustafa Suleyman, chefe de IA da Microsoft, classificou as tentativas da Anthropic de sugerir que…

1 hora atrás

A SkyDrive planeja lançar táxis voadores nos céus do Japão em 2028.

O pequeno setor de aviação elétrica atraiu um número significativo de startups, e a japonesa…

2 horas atrás