A Anthropic, fundada por ex-funcionários da OpenAI, anunciou o lançamento da próxima geração de modelos de inteligência artificial (IA), Claude 3. Esses modelos são o resultado de um trabalho árduo na área de aprendizado de máquina e representam uma melhoria significativa em relação aos seus antecessores e homólogos atuais de outros desenvolvedores, incluindo OpenAI e Google.

Fonte da imagem: Antrópico

Claude 3 é multimodal – a capacidade de compreender e processar dados textuais e visuais. Essa expansão da funcionalidade do modelo de IA não só o torna mais flexível de uso, mas também abre novos horizontes para sua utilização em diversas áreas, da educação à medicina.

A família Claude 3 inclui três modelos: Haiku, Sonnet e Opus. Este último é o modelo mais avançado, que a empresa descreve como o mais inteligente. Atualmente, os modelos Opus e Sonnet estão disponíveis aos usuários por meio do site oficial claude.ai e da interface de programação de aplicativos (API). O modelo Haiku, caracterizado pela alta velocidade de processamento de dados a um custo mínimo, será apresentado ao público num futuro próximo.

Recusas de respostas incorretas em Claude 3 em comparação com Claude 2.1.

Observe que, devido à compreensão contextual insuficiente, as versões anteriores do Claude às vezes se recusavam a responder a algumas solicitações dos usuários, mesmo que fossem inofensivas. Os novos modelos Claude 3 melhoraram a compreensão do contexto e são menos propensos a falhar na resposta, tornando-os mais adaptáveis ​​e flexíveis.

Claude 3 demonstra a excelente capacidade de processar e analisar materiais complexos, como artigos científicos, incluindo textos com tabelas e gráficos, em menos de 3 segundos. Isso o coloca entre os modelos mais rápidos e econômicos do mercado.

Modelos Claude 3 comparados com GPT-4, GPT-3.5 e Gemini 1.0 Ultra/Pro

Em vários benchmarks, o modelo Opus teve um desempenho melhor do que os seus homólogos OpenAI, especialmente em problemas que exigem raciocínio de nível de pós-graduação, onde superou o GPT-4, mostrando um resultado de 50,4% versus 35,7% para o GPT-4. Isso confirma suas altas habilidades analíticas e profundidade de compreensão do material.

Modelos Claude 3 treinados pela Antrópico usando um conjunto de dados misto, incluindo não apenas fontes disponíveis publicamente, mas também dados internos, o que lhes permitiu alcançar um processamento de informações de alta qualidade. Os modelos foram treinados no poder dos serviços em nuvem Amazon AWS e Google Cloud, o que enfatiza a escala e a importância do projeto. Tanto a Amazon quanto o Google investiram pesadamente no desenvolvimento da Anthropic, sinalizando um grande apreço pelo potencial de seus novos modelos de IA.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *