Bard, o chatbot de IA do Google, está melhorando lentamente na solução de problemas de lógica e raciocínio. O gigante da tecnologia falou sobre isso hoje em seu blog. Graças a uma técnica chamada “execução de código furtivo”, Bard tornou-se melhor em matemática e codificação.

Fonte da imagem: Pexels / Mojahid Mottakin
Como explica o blog, os Large Language Models (LLMs) como o Bard são essencialmente “mecanismos de previsão”. Quando recebem um prompt, eles geram uma resposta prevendo quais palavras são mais prováveis de vir a seguir na frase. Isso pode ajudá-los ao escrever e-mails e redações, mas será inútil ao escrever código.
Em um esforço para resolver essas deficiências em modelos de linguagem grandes, o Google desenvolveu uma técnica de “execução de código oculto” que permite que seu chatbot escreva e execute seu próprio código. A versão mais recente do Bard identifica pistas que podem ser úteis, escreve código sob o capô, testa-o e usa o resultado para gerar uma resposta mais precisa.

Fonte da imagem: Google
De acordo com testes internos, as respostas do novo Bard a problemas verbais e matemáticos foram aprimoradas em 30% em comparação com a versão anterior do chatbot. No entanto, os desenvolvedores observaram que, mesmo com essas melhorias, o Bard nem sempre funcionará corretamente. “Por exemplo, a Bard pode não gerar o código ou pode gerá-lo incorretamente e pode nem mesmo incluir o código executado em sua resposta”, escreveu o líder de produto da Bard, Jack Krawczyk, e o vice-presidente de engenharia Amarnag Subrahmanya em uma postagem no blog. Subramanya) .
Quando o Google lançou o Bard no início deste ano, ele não se comparava muito favoravelmente com o Bing Chat e o ChatGPT. Os funcionários do Google que testaram o Bard antes de seu lançamento tinham sérias preocupações sobre o chatbot, com uma pessoa chamando-o de “mentiroso patológico” e outro chamando-o de “pior do que inútil”. No entanto, o Google está tentando virar a maré com geração de código atualizado e outras melhorias para o Bard, incluindo suporte para novos idiomas, consultas multimodais e geração de imagens.
