Bard, o chatbot de IA do Google, está melhorando lentamente na solução de problemas de lógica e raciocínio. O gigante da tecnologia falou sobre isso hoje em seu blog. Graças a uma técnica chamada “execução de código furtivo”, Bard tornou-se melhor em matemática e codificação.

Fonte da imagem: Pexels / Mojahid Mottakin

Como explica o blog, os Large Language Models (LLMs) como o Bard são essencialmente “mecanismos de previsão”. Quando recebem um prompt, eles geram uma resposta prevendo quais palavras são mais prováveis ​​de vir a seguir na frase. Isso pode ajudá-los ao escrever e-mails e redações, mas será inútil ao escrever código.

Em um esforço para resolver essas deficiências em modelos de linguagem grandes, o Google desenvolveu uma técnica de “execução de código oculto” que permite que seu chatbot escreva e execute seu próprio código. A versão mais recente do Bard identifica pistas que podem ser úteis, escreve código sob o capô, testa-o e usa o resultado para gerar uma resposta mais precisa.

Fonte da imagem: Google

De acordo com testes internos, as respostas do novo Bard a problemas verbais e matemáticos foram aprimoradas em 30% em comparação com a versão anterior do chatbot. No entanto, os desenvolvedores observaram que, mesmo com essas melhorias, o Bard nem sempre funcionará corretamente. “Por exemplo, a Bard pode não gerar o código ou pode gerá-lo incorretamente e pode nem mesmo incluir o código executado em sua resposta”, escreveu o líder de produto da Bard, Jack Krawczyk, e o vice-presidente de engenharia Amarnag Subrahmanya em uma postagem no blog. Subramanya) .

Quando o Google lançou o Bard no início deste ano, ele não se comparava muito favoravelmente com o Bing Chat e o ChatGPT. Os funcionários do Google que testaram o Bard antes de seu lançamento tinham sérias preocupações sobre o chatbot, com uma pessoa chamando-o de “mentiroso patológico” e outro chamando-o de “pior do que inútil”. No entanto, o Google está tentando virar a maré com geração de código atualizado e outras melhorias para o Bard, incluindo suporte para novos idiomas, consultas multimodais e geração de imagens.

avalanche

Postagens recentes

A ESA lançou dois satélites Celeste em órbita para testar novas tecnologias de navegação.

A Agência Espacial Europeia (ESA) anunciou o lançamento bem-sucedido dos dois primeiros satélites da missão…

6 horas atrás

Os preços dos processadores Intel Arrow Lake Refresh subiram acima dos níveis recomendados 48 horas após o início das vendas.

No início deste mês, a Intel anunciou os processadores Arrow Lake Refresh, lançando o Core…

7 horas atrás

O Telegram afirma que não há nenhuma vulnerabilidade perigosa no aplicativo de mensagens.

O serviço de imprensa do Telegram afirmou que a vulnerabilidade crítica no aplicativo, recentemente relatada,…

8 horas atrás

As ações dos fabricantes de DRAM se estabilizam após o impacto inicial do TurboQuant.

Esta semana, o Google apresentou o TurboQuant, seu método de compressão de dados para IA,…

11 horas atrás

O lucro anual da BYD caiu pela primeira vez em quatro anos, expondo os horrores da guerra de preços na China.

A empresa chinesa BYD alcançou a liderança no mercado global de veículos elétricos, apesar de…

11 horas atrás