Bard, o chatbot de IA do Google, está melhorando lentamente na solução de problemas de lógica e raciocínio. O gigante da tecnologia falou sobre isso hoje em seu blog. Graças a uma técnica chamada “execução de código furtivo”, Bard tornou-se melhor em matemática e codificação.

Fonte da imagem: Pexels / Mojahid Mottakin

Como explica o blog, os Large Language Models (LLMs) como o Bard são essencialmente “mecanismos de previsão”. Quando recebem um prompt, eles geram uma resposta prevendo quais palavras são mais prováveis ​​de vir a seguir na frase. Isso pode ajudá-los ao escrever e-mails e redações, mas será inútil ao escrever código.

Em um esforço para resolver essas deficiências em modelos de linguagem grandes, o Google desenvolveu uma técnica de “execução de código oculto” que permite que seu chatbot escreva e execute seu próprio código. A versão mais recente do Bard identifica pistas que podem ser úteis, escreve código sob o capô, testa-o e usa o resultado para gerar uma resposta mais precisa.

Fonte da imagem: Google

De acordo com testes internos, as respostas do novo Bard a problemas verbais e matemáticos foram aprimoradas em 30% em comparação com a versão anterior do chatbot. No entanto, os desenvolvedores observaram que, mesmo com essas melhorias, o Bard nem sempre funcionará corretamente. “Por exemplo, a Bard pode não gerar o código ou pode gerá-lo incorretamente e pode nem mesmo incluir o código executado em sua resposta”, escreveu o líder de produto da Bard, Jack Krawczyk, e o vice-presidente de engenharia Amarnag Subrahmanya em uma postagem no blog. Subramanya) .

Quando o Google lançou o Bard no início deste ano, ele não se comparava muito favoravelmente com o Bing Chat e o ChatGPT. Os funcionários do Google que testaram o Bard antes de seu lançamento tinham sérias preocupações sobre o chatbot, com uma pessoa chamando-o de “mentiroso patológico” e outro chamando-o de “pior do que inútil”. No entanto, o Google está tentando virar a maré com geração de código atualizado e outras melhorias para o Bard, incluindo suporte para novos idiomas, consultas multimodais e geração de imagens.

avalanche

Postagens recentes

O novo telescópio espacial Roman da NASA concluiu seus principais testes, a menos de cinco meses do lançamento.

A NASA anunciou a conclusão dos principais testes do novo Observatório Espacial Nancy Grace Roman.…

43 minutos atrás

Os centros de dados causam mais danos do que benefícios à economia — o meio ambiente e a saúde humana sofrem.

Segundo estudos recentes, os centros de dados causam danos ambientais e à saúde pública que…

1 hora atrás

A Tencent e o Alibaba estão prontos para investir na DeepSeek, uma startup já avaliada em mais de 20 bilhões de dólares.

As gigantes chinesas de tecnologia Tencent Holdings e Alibaba Group estão em negociações para investir…

2 horas atrás

O processador topo de linha Ryzen 9 9950X3D2 Dual Edition, com cache 3D duplo, está à venda por US$ 899.

A AMD anunciou a disponibilidade do seu processador topo de linha, o Ryzen 9 9950X3D2…

2 horas atrás