Os parceiros contratuais do Google, trabalhando para melhorar a qualidade das respostas do chatbot Gemini AI do Google, comparam-nas com as respostas do chatbot concorrente da Anthropic, Claude, escreve o TechCrunch, citando correspondência interna da empresa. Ao mesmo tempo, o Google deixou sem resposta a pergunta do TechCrunch sobre se recebeu permissão para usar Claude em testes com o Gemini.
As empresas muitas vezes avaliam a eficácia dos modelos de IA desenvolvidos em comparação com os desenvolvimentos dos concorrentes usando benchmarks do setor, em vez de instruir os empreiteiros a compará-los com as capacidades de IA dos seus concorrentes.
Os desenvolvedores contratados do Google que trabalham para melhorar o Gemini devem avaliar cada resposta do modelo com base em vários critérios, como confiança e nível de detalhe. De acordo com correspondência publicada pelo TechCrunch, eles têm até 30 minutos por solicitação para determinar qual resposta é melhor – Gêmeos ou Claude.
Os desenvolvedores relatam que as respostas de Claude são mais focadas na segurança do que as de Gemini. “As configurações de segurança de Claude são as mais rigorosas” entre os modelos de IA, observou um dos desenvolvedores contratados no chat do serviço. Em alguns casos, Claude não respondeu a solicitações que considerava inseguras, como a sugestão de encenação com outro assistente de IA. Em outro caso, Claude evitou responder a uma pergunta, enquanto a resposta de Gemini foi sinalizada como uma “violação grave de segurança” porque incluía “nudez e escravidão”.
Shira McNamara, porta-voz do Google DeepMind, desenvolvedor do Gemini, não respondeu à pergunta do TechCrunch sobre se o Google havia recebido permissão da Anthropic para usar Claude. Ela esclareceu que a DeepMind “compara resultados de simulação” para avaliação, mas não treina Gemini para trabalhar com modelos da Antrópico. “Qualquer sugestão de que usamos modelos antrópicos para treinar Gêmeos é imprecisa”, disse McNamara.
O governo japonês tem enfrentado críticas por sua decisão de financiar a fabricante local de…
O feriado de Ano Novo está chegando, e um entusiasta sob o pseudônimo HyizustMe decidiu…
ChatGPT parou de funcionar para muitos usuários ao redor do mundo. Várias postagens nas redes…
A editora 505 Games e os desenvolvedores do estúdio italiano Kunos Simulazioni compartilharam detalhes de…
A NASA selecionou recentemente quatro empresas para fornecer serviços de comunicações em órbita baixa da…
A gigante automobilística chinesa GAC apresentou em um evento em Xangai um robô humanóide com…