Bard, o chatbot de IA do Google, está melhorando lentamente na solução de problemas de lógica e raciocínio. O gigante da tecnologia falou sobre isso hoje em seu blog. Graças a uma técnica chamada “execução de código furtivo”, Bard tornou-se melhor em matemática e codificação.

Fonte da imagem: Pexels / Mojahid Mottakin

Como explica o blog, os Large Language Models (LLMs) como o Bard são essencialmente “mecanismos de previsão”. Quando recebem um prompt, eles geram uma resposta prevendo quais palavras são mais prováveis ​​de vir a seguir na frase. Isso pode ajudá-los ao escrever e-mails e redações, mas será inútil ao escrever código.

Em um esforço para resolver essas deficiências em modelos de linguagem grandes, o Google desenvolveu uma técnica de “execução de código oculto” que permite que seu chatbot escreva e execute seu próprio código. A versão mais recente do Bard identifica pistas que podem ser úteis, escreve código sob o capô, testa-o e usa o resultado para gerar uma resposta mais precisa.

Fonte da imagem: Google

De acordo com testes internos, as respostas do novo Bard a problemas verbais e matemáticos foram aprimoradas em 30% em comparação com a versão anterior do chatbot. No entanto, os desenvolvedores observaram que, mesmo com essas melhorias, o Bard nem sempre funcionará corretamente. “Por exemplo, a Bard pode não gerar o código ou pode gerá-lo incorretamente e pode nem mesmo incluir o código executado em sua resposta”, escreveu o líder de produto da Bard, Jack Krawczyk, e o vice-presidente de engenharia Amarnag Subrahmanya em uma postagem no blog. Subramanya) .

Quando o Google lançou o Bard no início deste ano, ele não se comparava muito favoravelmente com o Bing Chat e o ChatGPT. Os funcionários do Google que testaram o Bard antes de seu lançamento tinham sérias preocupações sobre o chatbot, com uma pessoa chamando-o de “mentiroso patológico” e outro chamando-o de “pior do que inútil”. No entanto, o Google está tentando virar a maré com geração de código atualizado e outras melhorias para o Bard, incluindo suporte para novos idiomas, consultas multimodais e geração de imagens.

avalanche

Postagens recentes

A AMD apoiará a Crusoe, venderá seus chips e os alugará caso algo dê errado.

Segundo o The Information, a AMD fornecerá uma garantia de empréstimo de US$ 300 milhões…

2 horas atrás

A Lenovo estabeleceu um prazo limite para encomendas aos preços antigos; os preços irão aumentar ainda mais devido à escassez de memória.

A Lenovo notificou oficialmente seus parceiros sobre um aumento forçado de preços em diversas configurações…

3 horas atrás

O mistério dos “bonecos de neve” na periferia do sistema solar foi resolvido após seis anos.

A primeira fotografia de um "boneco de neve" muito além da órbita de Netuno foi…

3 horas atrás

A NASA definiu a próxima data para uma missão tripulada à Lua: 6 de março.

A NASA agendou a primeira missão tripulada à Lua para 6 de março. Ontem, 20…

7 horas atrás

Não apenas Cyberpunk 2077: jogos AAA para PC agora rodam em dispositivos Android potentes, mas com limitações.

A emulação de jogos de PC no Android está ganhando força e agora está acessível…

9 horas atrás

Não apenas Cyberpunk 2077: jogos AAA para PC agora rodam em dispositivos Android potentes, mas com limitações.

A emulação de jogos de PC no Android está ganhando força e agora está acessível…

9 horas atrás