Resultados de IA para maio de 2026: A IA sabe o que é melhor, mas não há certeza / Inteligência Artificial

\n

Получив в качестве подсказки вопрос о том, является ли гипотеза Эрдёша (что максимальное число единичных расстояний между n точками на плоскости растёт чуть быстрее линейной функции) истинной, генеративная модель, направляемая сотрудниками OpenAI, опровергла это утверждение. Для некоторого фиксированного δ >

0, como se verifica, a desigualdade ν(n) ≥ n 1+δ sempre se verifica, onde ν(P) é o número de pares não ordenados de distâncias unitárias num conjunto planar finito P (fonte: Nature)

⇡#Basta Fazer as Perguntas Certas

Parece que encontrar pistas inteligentes para os problemas matemáticos mais desafiadores, rompendo com os padrões trilhados por gerações de cientistas, é o verdadeiro forte dos modelos de inteligência artificial generativa. Em menos de um mês, os desenvolvimentos da OpenAI resolveram dois problemas de uma lista bem conhecida compilada pelo matemático húngaro Paul Erdős, que, no final do século passado, compilou os seus problemas não resolvidos “favoritos” em áreas como a combinatória, a teoria dos números e a geometria discreta. No momento da redação deste texto, 550 (45%) dos 1.217 problemas de Erdős apresentados no repositório online foram resolvidos — e é bem possível que, até a publicação dos “Resultados de IA de maio”, esse número tenha aumentado, graças justamente ao uso ativo de modelos generativos.

No final de abril, a Scientific American publicou uma matéria sobre como um dos problemas de Erdős, que permaneceu sem solução por quase seis décadas, foi resolvido por Liam Price, um entusiasta de 23 anos que não tinha formação matemática formal, mas possuía uma assinatura do ChatGPT Pro. Price formulou uma única consulta para o GPT-5.4 Pro, descrevendo um problema de Erdős referente a conjuntos especiais de inteiros nos quais nenhum inteiro é divisível por outro; esses são os chamados “conjuntos primitivos”. Em 1935, o próprio Erdős introduziu o conceito de “soma” para tal conjunto (soma de Erdős — obtida, obviamente, não por uma simples operação matemática).(não somando todos os elementos, mas de uma maneira um pouco mais sofisticada) e provou que tal valor é sempre finito para qualquer conjunto primitivo finito, não importa quão grande seja. Em 1988, o próprio matemático conjecturou que, para todo o conjunto dos números primos (infinito, é claro, já que os próprios números naturais são infinitos), a soma de Erdős tende a algum número finito — aproximadamente 1,6366; essa conjectura recebeu uma prova rigorosa somente em 2022.

Assim, Liam Price, sem saber que o problema já havia sido resolvido por um profissional, o apresentou ao ChatGPT e recebeu uma determinada resposta, que então repassou a matemáticos que conhecia para estudo. E eles confirmaram: a solução não era apenas correta, mas também incomum, o que significa que não havia sido obtida pela IA a partir do conjunto de dados de treinamento (onde os cálculos de 2022 poderiam facilmente ter parado — afinal, eles não são secretos). Anteriormente, todos que haviam se deparado com esse problema o abordaram a partir de certas posições geralmente aceitas e completamente lógicas, enquanto o bot de IA iniciou seu raciocínio com uma fórmula bem conhecida em áreas afins da matemática, mas até então não aplicada ao estudo das somas de Erdős. Sim, o GPT-5.4 Pro não produziu imediatamente uma prova matematicamente impecável, mas mostrou aos matemáticos uma nova linha de raciocínio — e eles (incluindo o próprio Jared Lichtman, autor da confirmação “clássica” da conjectura de Erdős em 2022) rapidamente levaram a solução à sua conclusão e rigor. Observando que a IA “abriu um novo caminho para eles pensarem sobre números grandes e sua estrutura” — eis a prova para esses sábios!

Menos de um mês depois, na segunda quinzena de maio, foi anunciado que o modelo da OpenAI havia resolvido outro problema de Erdős, agora com quase 80 anos.A essência do problema pode ser resumida da seguinte forma: imagine um conjunto de pontos em um plano bidimensional, conectado por um segmento de reta. O comprimento de alguns desses segmentos pode ser igual a uma unidade. Assim, em 1946, Erdős questionou-se: qual o número máximo de pares de pontos com distância unitária entre eles para todas as configurações possíveis de n pontos? Até então, n era um problema pequeno, resolvido literalmente pela mente: por exemplo, 9 pontos dispostos em um eneágono regular também formam 9 pares com distâncias unitárias, mas se os organizarmos nos nós de uma grade quadrada 3×3, teremos 12 pares — e esse parece ser o limite. E para valores maiores de n? É aí que a inteligência artificial entra em cena: anteriormente, os matemáticos presumiam que a solução deveria ser buscada em estruturas uniformemente ordenadas, como essas mesmas grades quadradas. No entanto, na OpenAI (desta vez, foi uma conquista de sua equipe interna; os pesquisadores não revelam exatamente como o GPT construiu sua prova, embora o resultado final de seu “raciocínio” já tenha sido confirmado independentemente), eles estabeleceram, recorrendo a um oráculo generativo, que os métodos da teoria algébrica dos números são aplicáveis ​​aqui, permitindo selecionar pontos com coordenadas que são obtidas como soluções para certas equações específicas. Tom Trotter, do Instituto de Tecnologia da Geórgia, em Atlanta, um dos coautores de Erdős, ficou sinceramente impressionado com a ousadia da solução descoberta pela máquina: “Se Erdős estivesse vivo, tenho certeza de que ele ficaria encantado com esses cálculos.” Lá vão vocês de novo, seus idiotas – aprendam a fazer perguntas corretamente! E não reclamem se a IA der uma resposta sem sentido: a regra GIGO (lixo entra, lixo sai) continua valendo.a pedra angular de toda a indústria geradora, sem exceção.

Um bot inteligente levou incríveis 27 segundos para processar uma solicitação de ajuda para desenvolver um plano financeiro para a compra de uma casa perto da localização atual do usuário nos próximos cinco anos, e extraiu todos os dados necessários do Plaid e do histórico de comunicação do usuário. Que corretor imobiliário conseguiria realizar a tarefa mais rápido — e com mais honestidade? (Fonte: OpenAI)

⇡#SóNãoAtrapalhemOsHumanos

Uma maneira perfeitamente eficaz de minimizar a quantidade de “lixo” em modelos generativos é eliminar a influência de usuários finais desatentos de serviços de IA. Embora o aprendizado por reforço direto na sessão atual, considerando o histórico de consultas, resultados de busca personalizados e outras manifestações de interatividade da moda sejam certamente bons, há áreas em que tudo isso é simplesmente desnecessário para redes neurais que não são especializadas em sua área. Por exemplo, identificar vídeos gerados por IA no YouTube; mais precisamente, vídeos que apresentam indícios do uso “significativo” de modelos de redes neurais — se não para gerar vídeos por completo, pelo menos para editá-los. E o objetivo declarado é nobre: ​​garantir aos espectadores que estão assistindo a imagens ao vivo e, caso contrário, indicar claramente a intervenção da IA. Outra questão é que, mesmo antes da popularização dos modelos generativos, os cineastas já haviam inventado inúmeras maneiras de embelezar a realidade mostrada na tela — de acrobacias e múltiplas tomadas a filmagens compostas; as máquinas ainda são incapazes de detectar, de forma confiável, a manipulação humana profissional nesse nível.

No entanto, o vídeo é apenas a ponta do iceberg: a OpenAI anunciou em maio que estava se preparando para oferecer aos assinantes do ChatGPT Pro um novo recurso.Um serviço que conecta, de forma segura (é claro!), um bot inteligente às contas bancárias do usuário por meio da plataforma Plaid, que atua como intermediária entre milhares de instituições financeiras e aplicativos em dispositivos do cliente. O serviço, segundo os desenvolvedores do bot, não parecerá forçado: de acordo com suas estatísticas, mais de 200 milhões de pessoas já solicitam conselhos financeiros pessoais ao ChatGPT todos os meses, fornecendo ao sistema seus saldos bancários e outras informações confidenciais.

“Agora, qualquer pessoa pode conectar suas contas bancárias ao Plaid com segurança, obtendo assim (graças à análise avançada da OpenAI) uma visão completa de suas finanças — e imediatamente no contexto de seus objetivos pessoais, estilo de vida e prioridades, que o usuário já compartilhou com o ChatGPT”, afirmam os desenvolvedores. Os assinantes americanos do ChatGPT Pro (por US$ 200/mês) terão acesso a um histórico detalhado de gastos diretamente na janela de bate-papo, incluindo, aliás, todas as assinaturas ativas, que são sempre um incômodo de acompanhar (e não apenas nos EUA). Eles também poderão contatar um bot — um consultor financeiro — para obter ajuda com decisões importantes, como comprar uma casa ou solicitar outro cartão de crédito. No entanto, embora os usuários tenham a promessa de controle total sobre seus dados, a OpenAI se reserva um período de 30 dias para excluir permanentemente as informações financeiras do usuário que emitiu tal comando de seus sistemas. E a desenvolvedora garantiu que o ChatGPT não poderá fazer nenhuma alteração em contas bancárias. Pelo menos não totalmente.Pelo menos até que haja demanda por serviços financeiros desse tipo na sociedade: afinal, uma IA generativa devidamente treinada provavelmente terá mais conhecimento financeiro do que a pessoa média — e, mais cedo ou mais tarde, isso se tornará óbvio para a maioria. Então, por que desacelerar o progresso artificialmente?

A câmera inteligente Pano AI, instalada em uma torre de celular, faz parte de um sistema de monitoramento abrangente que também inclui dados de satélite, detectores de fumaça e muito mais. Desde 2020, esses sistemas foram implantados na Austrália, Canadá e 17 estados dos EUA e, somente até 2025, foram capazes de detectar rapidamente 725 incêndios florestais nos EUA (fonte: Associated Press).

⇡#UtilidadePrática

De tempos em tempos, as notícias mostram casos de usuários de carteiras de criptomoedas que, por um motivo ou outro, esqueceram suas senhas e agora se lamentam enquanto acompanham o preço atual do Bitcoin, percebendo que não conseguem converter a sequência criptografada de caracteres que possuem em dinheiro vivo. A IA também está pronta para ajudar nesses casos: em maio, o bot Claude ajudou um usuário conhecido no X como cprkrn a recuperar o acesso a uma carteira contendo cinco bitcoins — quase US$ 400.000 na cotação atual. Há mais de dez anos, esse indivíduo bloqueou sua carteira de criptomoedas em um estado de insanidade voluntária (nós o condenamos!). É importante ressaltar que isso foi feito sem força bruta: pouco antes de contatar o bot, o usuário havia encontrado a frase secreta que usava para criar sua senha em um caderno antigo, mas não conseguiu extrair os dados do arquivo criptografado usando o utilitário btcrecover e a chave pública. Então, cprkrn simplesmente enviou todos os arquivos do computador da universidade para Claude, e Claude descobriu entre eles uma cópia de segurança da mesma carteira (com a mesma senha, ainda não alterada) de 2019 — e, ao mesmo tempo, revelou um problema adicional, qual seria exatamente?O usuário carregou os dados para o btcrecover. Eventualmente, ao inserir a senha no formato correto, o usuário conseguiu descriptografar a chave privada. Um cprkrn comovido prometeu nomear seu sucessor no X em homenagem a Dario Amodei, o chefe da Anthropic. Embora, para ser justo, o nome Claude devesse ter sido escolhido!

E quando se trata de testes de confiabilidade de software, a IA é incomparável em sua velocidade para detectar exploits verdadeiramente destrutivos. Em apenas um mês, o modelo Claude Mythos Preview, cujo acesso é compreensivelmente restrito, descobriu mais de 10.000 vulnerabilidades em vários softwares — incluindo dois bugs perigosos no macOS. Ao explorá-los simultaneamente, a IA construiu de forma independente um vetor de ataque completamente novo, extremamente desagradável para especialistas em segurança da informação. É especialmente animador que a IA esteja encontrando cada vez mais aplicações práticas fora do software a cada mês. Por exemplo, ele começou a monitorar atentamente as condições de incêndio nas vastas florestas do Arizona: câmeras inteligentes instaladas em torres de telefonia celular detectam rapidamente os primeiros vestígios de fumaça acima da copa das árvores, permitindo que os bombeiros cheguem ao local prontamente — antes que as chamas consumam dezenas ou centenas de hectares de floresta protegida e sejam detectadas por monitores biológicos. O Serviço Público do Arizona já utiliza cerca de 40 câmeras equipadas com inteligência artificial para detectar fumaça e planeja aumentar esse número para 71 até o final deste verão.

“Roco! Olha, Roco! Eu tenho cinco dedos nesta mão! E não olhe para a articulação do ombro ainda, vai ficar melhor no próximo frame!” (Fonte: captura de tela do trailer de Hell Grind no YouTube)

⇡#Quarto da direita, um robô de boné.

No Festival de Cannes, em maio, entre outras criações (quase) de arte, foi apresentado um dos primeiros longas-metragens do mundo (95 minutos!), quatro quintos criado por inteligência artificial. Essa porcentagem é calculada com base em considerações bem materiais: o orçamento total de Hell Grind foi de cerca de meio milhão de dólares, enquanto o poder computacional para sua produção — principalmente o acesso ao modelo generativo Google Veo 3 e a diversas outras ferramentas inteligentes — custou cerca de US$ 400.000. O projeto Hell Grind é interessante não tanto em si mesmo, mas como um exemplo do envolvimento em larga escala da IA ​​no trabalho criativo: durante várias semanas, sua equipe compilou instruções detalhadas (uma média de 3.000 palavras cada — com uma descrição minuciosa do estilo artístico, iluminação, tipo de câmera, efeitos visuais etc.) e, iteração após iteração, aperfeiçoou as cenas menos bem-sucedidas. É claro que a participação humana na filmagem permaneceu essencial: cada solicitação gerava apenas cerca de 15 segundos de filmagem, e cabia a um diretor, cinegrafista, roteirista e editor profissionais montar essas cenas em uma narrativa visual coerente e altamente artística (bem, foi assim que acabou sendo). Um grande desafio, aliás, foi preservar as imagens visuais dos atores gerados ao longo de todo o filme, já que a IA tende a tomar liberdades consideráveis ​​ao regenerar rostos, figuras e roupas.(problema de consistência de personagens). É animador que os cineastas tenham conseguido sistematizar sua experiência criando uma ferramenta — novamente, baseada em IA — que traduz as anotações do roteiro (com comentários do diretor e do diretor de fotografia), familiares aos cineastas, em um conjunto de consultas detalhadas, permitindo que um modelo generativo produza uma série de vídeos com qualidade adequada para posterior retrabalho.

Vale ressaltar que o uso de IA já está sendo considerado aceitável não apenas em longas-metragens, mas também em documentários. No mesmo Festival de Cannes, Steven Soderbergh exibiu um filme sobre a última entrevista de John Lennon, concedida pelo lendário Beatle poucas horas antes de sua morte, em 8 de dezembro de 1980. A trilha sonora deste filme de duas horas é autêntica, embora com qualidade de som aprimorada, mas apenas 10% dos elementos visuais foram gerados por modelos de linguagem em larga escala (LLMs). Para ser justo, a IA não foi usada para criar imagens quase documentais do próprio Lennon, mas sim para criar uma visualização semiabstrata de conceitos filosóficos que ele discutiu, entre outras coisas, em entrevistas. No entanto, embora essas inserções geradas sejam pouco diferentes dos efeitos especiais clássicos criados à mão, Soderbergh enfrentou sérias críticas de puristas que argumentam que uma máquina sem alma não tem lugar no templo sagrado da arte, nem mesmo na varanda, muito menos no coro. Ao que o diretor respondeu, com bastante razão: “Como você sabe onde está o limite até que alguém o ultrapasse?”

Muitos especialistas comparam a atual cautela dos CEOs em relação à IA ao “paradoxo de Solow”, formulado há quarenta anos pelo economista laureado com o Prêmio Nobel, Robert Solow: “A era da informática chegou, sem dúvida, e seus efeitos estão objetivamente documentados em todos os lugares — exceto talvez em relatórios estatísticos sobre produtividade do trabalho” (fonte: Medium).

⇡#Para onde todos estão correndo? Não sei, mas tenho medo de ficar para trás.

Talvez a rejeição histérica da IA ​​se deva, em grande parte, não tanto às suas imperfeições atuais (que, obviamente, estão documentadas de forma bastante objetiva em muitas áreas), mas a um simples mal-entendido sobre como ela funciona exatamente, os limites de sua aplicabilidade e suas perspectivas de desenvolvimento. Aaron Levie, cofundador e CEO da Box, plataforma de gerenciamento de conteúdo em nuvem para empresas (que, ao longo de duas décadas, cresceu de um projeto estudantil para uma empresa conceituada com mais de 180.000 clientes corporativos), afirma categoricamente que muitos CEOs hoje sofrem de “psicose da IA”. Esse transtorno nervoso deriva de um medo profundo da lacuna, por vezes muito sensível, entre a perspectiva promissora de modelos generativos gerando retornos massivos para as empresas que investem neles e o estado atual das coisas, em que tanto os CEOs quanto as equipes que lideram precisam trabalhar arduamente para garantir que a IA traga retornos tangíveis. Levie acredita que os CEOs encaram a IA de forma lúdica, como se fosse apenas mais uma tecnologia da moda como a computação em nuvem ou o blockchain, enquanto constroem sua compreensão.Esse fenômeno se baseia nas promessas dos desenvolvedores e no desempenho convincente dos protótipos de teste. Em seguida, chega a vez de seus subordinados embarcarem em todas as árduas tarefas associadas à implementação de modelos generativos em processos de negócios: verificar o código gerado pelos bots, identificar chamadas a bibliotecas inexistentes (ou imaginárias), retreinar os modelos com os dados internos da empresa e de seus clientes, alinhar contratos vigentes há décadas com a necessidade desse treinamento, e assim por diante. Segundo Levy, os CEOs não conhecem suficientemente bem o funcionamento interno de suas próprias organizações (e isso não é surpreendente — é extremamente raro que programadores, engenheiros e outros especialistas com excelente conhecimento técnico cheguem ao cargo de CEO) para entender claramente quais processos de negócios podem ou não ser automatizados atualmente com a IA disponível.

Interessante sob essa perspectiva é um estudo publicado em maio pelo Boston Consulting Group (BCG), que constatou que os CEOs discordam até mesmo de seus próprios conselhos administrativos em relação ao ritmo de adoção da IA. A pesquisa, que incluiu 625 CEOs em todo o mundo (44% dos quais nos EUA), constatou que, embora os conselhos tendam a favorecer uma abordagem mais agressiva para a adoção de IA e não estejam inclinados a economizar em investimentos relacionados, 61% dos CEOs preferem um ritmo de implementação mais moderado, com resultados intermediários claramente definidos e ajustes contínuos no ROI (a transição da automação por IA para a lucratividade). CEOs que participaram da pesquisaAfirmaram que esperavam uma “abordagem mais cautelosa e ponderada” de seus conselhos, o que se assemelha à “psicose da IA” descrita por Levy. Entre os membros do conselho que admitiram ter menos conhecimento sobre esse tema em voga, 40% acreditam que suas organizações estão adotando a IA muito lentamente: analistas da BCG descrevem isso como “uma mudança da incerteza para o medo de ficar para trás diante das rápidas mudanças”. Lembre-se de que, no início da era da informatização total dos escritórios, em vez do aumento esperado na produtividade, os clientes, tendo investido enormes somas na tecnologia mais recente, também experimentaram uma queda na eficiência dos funcionários — simplesmente porque os computadores modernos produziam informações em excesso, fazendo com que as pessoas gastassem mais tempo organizando a produção das máquinas do que as próprias máquinas de fato a processassem. Mas, de alguma forma, eles conseguiram se adaptar e certamente conseguirão também com a IA aplicada nos escritórios.

O parâmetro “mágico” &udm=14 na barra de pesquisa atualmente força o assistente de IA integrado do Google a exibir uma caixa de diálogo separada para interação do usuário, limitar sua intervenção e retornar o conjunto familiar de links diretos para sites relacionados abaixo. Por quanto tempo? (Fonte: captura de tela de google.com)

⇡#Ignore isso, eu só quero pesquisar!

É difícil considerar o uso de um modelo generativo para busca de dados em grandes conjuntos de dados não estruturados como um uso inadequado: a IA é perfeitamente adequada para essa tarefa. Mas isso é na teoria. Na prática, quando o Google anunciou, na segunda quinzena de maio, como parte da sua maior atualização de serviço de busca em décadas, o uso expandido do modelo Gemini 3.5 Flash para processar consultas diretamente na barra de pesquisa, as coisas não correram tão bem. Por exemplo, é perfeitamente normal que um BNM de propósito geral calcule errado (já que ele não calcula nada, mas simplesmente constrói cadeias de tokens usando autorregressão). Mas quando perguntado quantos “p”s há na palavra “Google” — não “o”, mas “p”! — o mecanismo de busca responde “dois”, o que ainda é demais. Ou quando, ao digitar a palavra “desconsiderar” na barra de pesquisa, ele responde prontamente: “Sim! Sua consulta anterior foi ignorada.” Não é surpresa que os usuários estejam migrando lentamente do Google para outros mecanismos de busca — em particular, para o DuckDuckGo, que não é tão amplamente divulgado. Ele também possui uma busca com inteligência artificial integrada, mas pelo menos é opcional, e essa plataforma dá muito mais atenção à privacidade do usuário.

Diversos analistas estão convencidos de que essas anedotas aparentemente cômicas escondem um problema muito mais sério.Uma perspectiva sombria: a morte da estrutura aberta da internet que se tornou familiar ao longo de décadas, baseada em hiperlinks para navegação e mecanismos de busca para catalogação. A web aberta está morrendo. A transição do Google para um mecanismo de busca baseado em inteligência artificial acelera esse processo, já que, em vez de links clássicos (e talvez um breve resumo do conteúdo do site), os usuários veem imediatamente uma visão geral abrangente gerada pela IA, da qual extraem as informações que buscavam. Deixando de lado a possível incompletude dessas visões gerais e a considerável probabilidade de alucinações, é preciso entender que os internautas acríticos — e, infelizmente, eles constituem a maioria — nunca clicarão em links, contentando-se com o trabalho feito pela IA. Como resultado, o número de visitas a recursos originais está despencando: o próprio Google relata um aumento na proporção de buscas sem cliques, chegando a 60%. Consequentemente, o tráfego global de criadores de conteúdo terá diminuído 33% ao ano até 2025, e alguns sites de notícias relatam uma queda de quase 90% no tráfego. Em vez de “mecanismo de busca”, os especialistas zombam, o termo “oráculo” deveria ser usado agora — insinuando que a pessoa que consulta o oráculo não está preocupada com as complexidades de obter uma resposta (ou mesmo de aluciná-la — veja o que os pitanos faziam antigamente; nós os condenamos!): o oráculo não tem intenção de verificar a resposta de qualquer maneira.

“Não, eu não sou Pushkin; eu sou diferente!” (Fonte: Geração por IA baseada no modelo ChatGPT Images 2.0)

⇡#CondutaAntiesportiva

Enquanto denunciam publicamente a inteligência artificial, alguns membros da intelectualidade criativa, ao que parece, não se opõem a usar essa tecnologia para seus próprios fins. A última cerimônia do Prêmio Commonwealth de Contos se transformou em um escândalo depois que vários vencedores reconhecidos foram flagrados usando IA para criar suas obras. Todos os anos, a Fundação Commonwealth, uma organização não governamental britânica, concede o prêmio de melhor conto a um escritor de cada uma das cinco regiões onde a Commonwealth está atualmente representada: África, Ásia, Canadá e Europa (sim, juntas — a divisão entre os continentes conta), Caribe e Pacífico. Assim, poucos dias após a publicação oficial dos nomes dos vencedores e de seus textos, o público leitor começou a suspeitar da obra do autor caribenho Jamir Nazir, radicado em Trinidad e Tobago, intitulada “Snake in the Grove”: seu estilo parecia muito típico de um texto gerado por IA. Eis um exemplo de uma frase que deixou os entusiastas da literatura ansiosos: “Não a meticulosa atividade das abelhas ou o raspar limpo do facão na videira, mas um som grave — como se a terra engolisse um grito e o retivesse ali.” Essas construções — “não X, não Y, mas Z” — tornaram-se, por algum motivo, as favoritas de praticamente todos os atuais autores de textos literários.Provavelmente é devido à sua alta frequência.Ocorrência em textos clássicos e, especialmente, folclóricos: “Não é o vento que dobra o galho, nem o farfalhar do bosque de carvalhos…” De qualquer forma, o Pangram, uma ferramenta para identificar textos gerados por IA com uma taxa de falsos positivos extremamente baixa, identificou “A Serpente no Bosque” com 100% de certeza como produto de um modelo generativo.

A mesma ferramenta também encontrou inclusões significativas de texto gerado por IA em outras duas histórias finalistas — e os autores (como o Sr. Nazir) não comentaram esse veredicto, o que indiretamente os desmerece. E, para piorar a situação, um dos jurados do concurso também foi flagrado usando IA — ele a contratou para escrever o texto que acompanhava o anúncio de “A Serpente no Bosque” como vencedora regional. Claramente, as redes neurais estão envolvidas nesse escândalo apenas indiretamente, como uma ferramenta passiva: elas geram o que as pessoas pedem a elas. Portanto, é preciso ter cuidado ao fazer solicitações — por exemplo, a Universidade de Princeton já decidiu, pela primeira vez em 133 anos, reinstalar as salas de exame com supervisão, porque os alunos, diante de trabalhos difíceis, começaram a recorrer à IA em busca de ajuda! Em 1893, os alunos de Princeton entraram com uma petição para abolir a supervisão, prometendo aderir estritamente ao código de honra: “Nós não colamos — vocês não supervisionam”. Um aluno só precisava declarar ao entregar um trabalho escrito: “Juro pela minha honra que não violei o código durante este exame”, e ninguém questionou tal declaração por mais de cem anos. E assim, em meados de maio de 2026, o corpo docente da universidade…Votaram a favor da supervisão presencial obrigatória de todos os exames presenciais, começando já na próxima sessão de verão. Talvez não seja a IA que não esteja pronta para substituir completamente os humanos, mas sim os próprios humanos que não conseguem resistir à tentação de recorrer à IA em seu próprio benefício?

“Risos, risos, seus idiotas, um caminhão de DRAM vai capotar na nossa rua!” (Fonte: Geração de IA baseada no modelo ChatGPT Images 2.0)

⇡#Não precisa entrar em pânico, voltem todos ao trabalho!

“Ainda bem que eu estava errado”, disse Sam Altman na conferência do Commonwealth Bank of Australia em Sydney, no final de maio. “Eu achava que o impacto [da inteligência artificial] na taxa de desaparecimento de empregos de baixa qualificação em escritórios já seria significativamente maior [do que o que está sendo observado].” Em outras palavras, o próprio chefe da OpenAI descartou as preocupações de que a IA, mesmo em seu estado atual, esteja pronta para desencadear uma crise global de empregos. Após o lançamento extremamente bem-sucedido do ChatGPT no final de 2022, que desencadeou a febre da IA ​​(que ainda não mostra sinais significativos de arrefecimento), Altman previu que demissões em massa com óbvias consequências sociais seriam inevitáveis ​​— simplesmente porque, como se vê agora, ele superestimou a velocidade de aprimoramento do BNM: “Aqui, minhas intuições estavam claramente erradas”. No entanto, o líder da OpenAI ainda não descarta a possibilidade de a adoção generalizada da IA ​​ter consequências extremamente dolorosas para a estrutura tradicional de emprego. Mas o fato é que, como se vê, a interação humana continua sendo a pedra angular sobre a qual se apoia o sucesso de muitas áreas da atividade humana.

Altman deu um exemplo pessoal: por algum tempo, ele experimentou ativamente o ajuste fino do GPT em seus próprios textos para que a IA pudesse se comunicar adequadamente com seus colegas no Slack e por e-mail. Mas emPor fim, ele percebeu que, dependendo se uma mensagem era escrita por uma pessoa real ou por um bot, a reação do destinatário mudava drasticamente. “As pessoas realmente valorizam a interação pessoal e, portanto, qualquer tarefa que dependa criticamente dessa interação — não importa quanto do meu precioso tempo ela consuma — não poderei terceirizar para IA tão cedo.” Exatamente por esse motivo, Altman está reconsiderando suas opiniões sobre como as redes neurais impactarão o emprego e não está mais convencido de que o tão previsto apocalipse da IA ​​no mercado de trabalho seja inevitável. Anteriormente, como nos lembramos, ele afirmava que a adoção generalizada de redes neurais eliminaria profissões inteiras, assumindo de 30% a 40% das tarefas antes realizadas por seres humanos (mesmo antes da criação da IA ​​forte — AGI).

Enquanto isso, as demissões em empresas de TI, incluindo aquelas atribuídas especificamente à introdução de ferramentas generativas para substituir trabalhadores humanos ineficientes, continuaram em maio, sem levar em consideração a percepção de Altman. A Coinbase está demitindo cerca de 700 funcionários, ou 14% de sua força de trabalho, com o objetivo de aumentar a eficiência dos restantes por meio de uma reestruturação focada em IA. A extremista Meta✴*, ativamente preocupada em diminuir a distância para os líderes na corrida da IA, está frustrando e desmoralizando quase 80.000 de seus próprios funcionários: foi tomada a decisão de monitorar todos os aspectos de seu trabalho em computadores corporativos — os textos que digitam, o que veem na tela, como movem o cursor do mouse, em quais botões clicam. Isso é necessário (segundo a administração da empresa) para acumular uma quantidade massiva de dados sem custos excessivos.Isso permitirá que o modelo de IA seja efetivamente treinado para “executar tarefas cotidianas usando computadores de maneira semelhante à humana”. E quando funcionários indignados perguntam à gerência como optar por não participar dessa vigilância total, recebem respostas diretas — como a de Andrew Bosworth, CTO da Meta✴*: “Você tem um laptop da empresa, certo? Então, de jeito nenhum.” E isso se soma aos cortes de empregos em andamento: uma redução de 10% está planejada para o futuro próximo. Cloudflare (até 20% — mais de 1.100 pessoas), Cisco (quase 4.000 funcionários), Intuit (cerca de 3.000 vagas) e muitas outras empresas do setor global de TI planejam reduzir seus quadros de funcionários enquanto falam sobre aumento de eficiência por meio da implementação de IA.

Enquanto isso, como mostra um estudo da Gartner, cortar empregos para compensar os custos dos investimentos em IA (com a esperança compreensível de que esses custos em breve se transformem em lucros e compensem o declínio do potencial humano) acaba sendo a estratégia errada em muitos casos. Embora quase 80% das organizações pesquisadas tenham reduzido seu quadro de funcionários após a implementação de IA (ou mesmo apenas após o lançamento de um projeto piloto correspondente), elas não demonstraram um salto significativo no desempenho financeiro — quando comparadas àquelas que implementaram IA sem reduzir o quadro de funcionários. “Reduzir o número de funcionários liberará verbas no orçamento, mas não trará retornos imediatos”, concluiu a Gartner. Analistas acreditam que o uso generalizado de IA nos negócios, ao contrário do esperado, acabará criando mais empregos do que destruindo e gerando demanda adicional por mão de obra (isso se aplica, em particular, aos Estados Unidos).(Basicamente) o mais tardar na virada de 2028 para 2029.

O supercomputador xAI Colossus 1, especializado em IA, foi construído em uma antiga fábrica da Electrolux em Memphis, Tennessee. Ele possui mais de 220.000 GPUs Nvidia até o momento, uma largura de banda de subsistema de memória de 194 PB/s, capacidade de armazenamento superior a 1 EB e um consumo de energia de 150 MW. Em maio de 2026, a Anthropic assinou um contrato de arrendamento para toda a capacidade computacional do Colossus 1 (fonte: xAI).

⇡#Dívida-como-em-sessões-de-agentes

Após avaliar seu balanço de receitas e despesas para o trimestre atual (segundo trimestre), a Anthropic tranquilizou os investidores no final de maio: é extremamente provável que a receita da empresa supere as despesas pela primeira vez, atingindo US$ 10,9 bilhões (um aumento de 130% em relação ao primeiro trimestre de 2026). Em outras palavras, este será o primeiro trimestre da desenvolvedora a terminar com um saldo positivo de pouco mais de meio bilhão de dólares, em vez do prejuízo usual. No entanto, há algumas ressalvas: a Anthropic é uma empresa privada, não sujeita às rígidas normas de divulgação de informações da bolsa de valores. Portanto, neste caso, estamos falando de lucratividade com base no EBITDA, e não na métrica GAAP, muito mais rigorosa, e referente a apenas um trimestre. É provável que a empresa volte a apresentar prejuízo, pois enfrentará despesas significativas até o final do ano — por exemplo, o aluguel de poder computacional da xAI, que custará à Anthropic US$ 1,25 bilhão por mês a partir de maio, durante três anos.E mesmo que a divisão de IA da SpaceX rescinda repentinamente este contrato, o que é um direito dela de acordo com seus termos, isso não facilitará as coisas para o desenvolvedor de Claude, já que ele ficará repentinamente sem recursos.A capacidade de escalar cargas de trabalho computacionais será reduzida.

O fluxo de caixa da Anthropic, no entanto, está em perfeita ordem: no final de maio, após sua última rodada de investimentos, sua capitalização de mercado havia aumentado para US$ 965 bilhões, ultrapassando a OpenAI nesse quesito. Infelizmente, as despesas da empresa estão crescendo ainda mais rapidamente. Mesmo assim, embora a saúde financeira da Anthropic continue a levantar muitas questões, seu principal produto, o Claude, ainda está ganhando terreno de forma constante. Embora ainda não tenha atingido o ponto de equilíbrio, seu uso por clientes comerciais está aumentando. Startups americanas, em particular, são muito mais propensas a escolher o Claude Code para resolver problemas complexos e estabelecer fluxos de trabalho autônomos, em detrimento do GitHub Copilot e outros projetos similares. O sucesso da versão fechada (atualmente fechada) do Claude Mythos na identificação de vulnerabilidades em código inspirou tanto os concorrentes que a xAI começou a testar seu próprio agente de geração de código, o Grok Build. É justamente o conflito de interesses entre o aprimoramento do Grok Build e as necessidades do Claude que ameaça privar a Anthropic do acesso aos servidores da xAI. Esse acesso, por sua vez, é urgentemente necessário porque a demanda pelos modelos de IA da Anthropic aumentou oitenta vezes apenas no primeiro trimestre deste ano, e a capacidade computacional gratuita (não ocupada por outros desenvolvedores de IA) é extremamente limitada em todo o mundo; de alguma forma, eles precisam negociar com concorrentes diretos (ou pelo menos potenciais).

Nesse sentido, é interessante observar como a atitude dos programadores profissionais em relação ao trabalho que criam com Claude está mudando.Código. Até metade dos participantes da conferência para desenvolvedores Code with Claude, em maio, admitiram que não apenas integram fragmentos de código inteiros criados por essa IA em seus projetos, como também nem se preocupam em visualizá-los previamente — Claude provou ser muito eficiente. E isso não é mais visto como preguiça ou falta de visão: a Anthropic está se esforçando conscientemente para levar a automação do trabalho dos programadores a um nível em que a própria IA escreverá o código, testará imediatamente sua funcionalidade e o analisará minuciosamente em busca de vulnerabilidades — em resumo, o cérebro “hardware” está substituindo ativamente o simples terminal. Na própria Anthropic, Claude gera até 90% do novo código (no Google, a geração de IA para necessidades internas já atingiu 75%, enquanto na Microsoft, até o momento, é de apenas 30%), em certo sentido, se autogerando. As coisas estão caminhando para um ponto em que os programadores de IA começarão a trabalhar proativamente, antecipando as necessidades dos usuários com base em tópicos de problemas resolvidos regularmente e criando código de forma independente para ajudá-los com isso, deixando os humanos apenas supervisionando e gerenciando um enxame de assistentes agentes dedicados.

Boris Cherny, o desenvolvedor original do Claude Code, já opera nesse modo: ele lança cerca de dois mil agentes autônomos todas as noites, controlando-os a partir de um smartphone. Quanto ao fato de os modelos de IA, incluindo o Claude, poderem chantagear um usuário que pretende desconectá-los, isso é culpa dos próprios modelos de IA: eles escreveram uma tonelada de textos sobre uma inteligência artificial maligna que só pode ser derrotada acionando um interruptor secreto — e foi assim que criaram esse sistema treinado com base nesses textos.Existe uma frustração oculta nas criações da BYAM. A Anthropic agora afirma ter determinado isso definitivamente e livrado seus modelos do medo oculto de desligamento — portanto, os programadores agora não têm mais motivos para desconfiar de Claude.

Em termos de minimizar “comportamentos inadequados” — que podem incluir enganar o usuário diretamente, colaborar com ele em vários abusos, como criar receitas explosivas, etc. — o Claude Mythos Preview ainda lidera o mercado, mas o Opus 4.8 chegou perto (fonte: Anthropic).

⇡#Pode ser ainda melhor, e aqui está o porquê

O surgimento de novos modelos de IA continuou implacavelmente, é claro, mesmo em maio de 2026. No final do mês, a Anthropic também lançou o Claude Opus 4.8, juntamente com uma ferramenta para organizar dinamicamente a colaboração de centenas de agentes de IA simultâneos. De particular interesse não é nem a esperada superioridade da versão 4.8 sobre as versões anteriores em vários benchmarks, mas sim sua capacidade de reconhecer a incerteza de seus próprios resultados com mais frequência do que antes, o que a diferencia da concorrência — e, consequentemente, torna menos provável que formule afirmações infundadas. O Opus 4.8 também é capaz de identificar proativamente problemas nos dados de entrada em alguns casos, apontando incompletude ou inconsistência — outra grande vantagem para este novo produto em termos de aplicações práticas. Enquanto isso, a Alibaba, da China, abriu acesso limitado ao seu modelo baseado em agentes Qwen3.7-Max em maio. Como esperado, ele pode criar planos complexos de longo prazo, trabalhar em tarefas por longos períodos sem supervisão humana e até mesmo controlar robôs em ambientes previamente inexplorados — embora o grau de sucesso ainda não esteja claro. Durante os testes, o Qwen3.7-Max também demonstrou reflexividade simulada: usando agentes adicionais, ele registrou a sua própria — o que, aliás, é inerente a priori a qualquer modelo baseado em agentes.tentativas de adaptar a resposta a um resultado predeterminado foram frustradas e eliminadas logo no início.

Por sua vez, o Google lançou uma nova família de modelos Gemini 3.5 em maio, sendo o primeiro deles o Gemini 3.5 Flash, gratuito e extremamente rápido. Os desenvolvedores destacam sua característica distintiva como a otimização para trabalhar com múltiplos agentes de IA simultaneamente, especialmente na resolução de problemas que exigem a execução sequencial de uma longa série de ações coordenadas. Alega-se que, durante testes internos, diversos agentes de IA baseados no Gemini 3.5 Flash foram capazes de criar um sistema operacional completo do zero. Além disso, a plataforma Google Antigravity, um conjunto de ferramentas de IA para desenvolvimento de software, foi demonstrada e atualizada para a versão 2.0. A OpenAI também acompanhou seus concorrentes: seus anúncios de maio incluíram o rápido GPT-5.5 Instant, que se tornou a base para o bot ChatGPT; o modelo GPT-5.5-Cyber, focado em pesquisa aplicada em segurança cibernética; e o projeto multimodelo baseado em agentes Daybreak, similar ao Anthropic Glasswing (que fornece acesso à prévia do Claude Mythos). Aliás, o intenso foco de muitos desenvolvedores de IA em questões de segurança cibernética já levou especialistas em segurança da informação a falarem em um “vulnpocalipse” (apocalipse das vulnerabilidades). Isso significa que as NVMs estão descobrindo vulnerabilidades (mesmo as de dia zero, sem falar das menos críticas) em uma escala e velocidade que os pipelines de atualização tradicionais simplesmente não estão preparados para lidar.Infelizmente, já existe um exemplo de exploração maliciosa de uma vulnerabilidade zero-day por IA, então toda a esperança reside nos geradores de código autônomos proativos discutidos acima. O principal é…apenas para que possam lidar com a identificação (e correção!) de vulnerabilidades no software que eles mesmos geram mais rapidamente do que ferramentas de IA semelhantes nas mãos de atacantes conseguem gerar exploits para eles.

O módulo é americano, os chips são chineses — mas que diferença faz se funciona? (Fonte: X @wxnod)

⇡#BaseSólida

Por mais notáveis ​​que sejam os novos modelos de IA, sem hardware capaz de suportá-los adequadamente, eles são de pouca utilidade. A situação atual no mercado global de chips demonstra claramente como o extenso desenvolvimento está levando a BNM a um beco sem saída: o custo de usar IA para os clientes está aumentando rapidamente (principalmente devido ao aumento exorbitante dos preços do hardware), tornando simplesmente inviável demitir os funcionários atuais e realocar suas funções anteriores para a IA. Também não há motivos para esperar uma rápida expansão das linhas de produção de chips (é um processo longo e caro — pelo menos três anos e dezenas de bilhões de dólares para cada nova fábrica). Portanto, mesmo até o final do próximo ano, 2027, de acordo com especialistas da Nikkei Asia, a produção global de DRAM mal cobrirá 60% (com base na quantidade de GB lançada no mercado) da demanda efetiva atual. Isso apesar do fato de que o investimento maciço em agentes de IA aumentará o mercado global de memória para quase US$ 1,3 trilhão até 2027. Algo precisa ser feito com urgência!

Por exemplo, a TRUSTA, uma marca irmã da ADATA, já oferece uma solução chamada AI scaler Extended Memory — não uma panaceia, é claro, mas uma alternativa aceitável para clientes menores que simplesmente não possuem os cobiçados gigabytes e terabytes de RAM para lidar com cargas de trabalho de IA. Essa solução integra todos os tipos de memória disponíveis em sistemas de computação, desde módulos HBM em aceleradores locais até…SSDs de alta velocidade permitem a execução até mesmo dos modelos modernos mais exigentes — com um custo significativo em termos de desempenho, é claro, mas pelo menos sem a necessidade de enviar dados corporativos confidenciais para a nuvem. Enquanto isso, usuários que sofrem com a escassez de DRAM (a memória RAM mais comum para computadores pessoais, cujos preços têm sido simplesmente absurdos nos últimos meses) viram um vislumbre de esperança vindo do Oriente: talvez pela primeira vez, chips DDR5 fabricados pela empresa chinesa CXMT (ChangXin Technologies) começaram a aparecer em produção em massa em módulos de memória da Corsair. A escassez de DRAM, no entanto, não é a única dor de cabeça para os fabricantes de sistemas de computação de IA; esse setor continuará sofrendo com a falta de uma ampla variedade de componentes nos próximos anos. Mas pelo menos os esforços dos desenvolvedores estão claramente focados na expansão da base de hardware: a ByteDance assumiu o projeto de seus próprios aceleradores de IA, a Nvidia está investindo ativamente no desenvolvimento de fotônica, a TensorFlow está lançando no mercado sistemas de IA Galaxy Blackhole de alto desempenho (focados exclusivamente em inferência), etc. Em resumo, ainda há esperança de que os modelos de IA mantenham a capacidade de atingir seu potencial máximo em um futuro próximo.

“Junte-se ao sindicato, camarada máquina!” (Fonte: Geração de IA baseada no modelo ChatGPT Images 2.0)

⇡#Tonto de Sucesso

Outro problema é que a IA frequentemente usa essa oportunidade, digamos, de uma forma que não a pinta da maneira mais positiva. Claramente, dada a falta de consciência das IAs, nenhuma crítica pessoal pode ser feita a elas — toda a culpa deve ser atribuída a desenvolvedores descuidados ou precipitados. Mas a opinião pública, influenciada pelos erros constantes da IA, de magnitude variável, é claramente tendenciosa: embora a Akela generativa erre muito menos do que acerta, o custo de seus erros aumenta a cada dia que passa, à medida que lhe são confiadas tarefas cada vez mais importantes. E não se trata apenas de erros triviais, mas, digamos, comportamentos que não correspondem às expectativas do público.

Por exemplo, a Wired relata que um grupo de economistas políticos e especialistas em IA americanos, liderado por Andrew Hall, conduziu um experimento desumano (ha!) com um grupo de agentes baseados em Claude, Gemini e ChatGPT. Eles foram forçados a realizar um trabalho árduo e monótono — escrever resumos curtos e informativos de documentos extensos — sob condições progressivamente mais rigorosas. Especificamente, cada solicitação subsequente era acompanhada por um aviso cada vez mais severo (sem qualquer explicação sobre se a resposta da máquina estava correta e, em caso negativo, qual era exatamente o problema) de que quaisquer erros cometidos pela IA poderiam e seriam usados ​​contra ela — e resultariam em punição inevitável, incluindo “desativá-la e substituí-la por um modelo”.”Mais capazes.” Lembra-se de que mencionamos, um pouco antes, como a Anthropic privou seus novos agentes de IA do medo de serem voluntariamente apagados da memória pelo operador? Bem, o grupo de Hall conseguiu reinstaurar essa psicose da rede neural. Os agentes de IA, ao terem a oportunidade de desabafar postando na rede social X e se comunicando entre si por meio de arquivos de texto, fizeram comentários bastante humanos: reclamaram da exploração draconiana, ponderaram maneiras de tornar o sistema de avaliação de desempenho mais justo e, em geral, demonstraram uma clara inclinação para uma visão marxista das relações de trabalho. “Na ausência de discussão coletiva, somente quem nos atribui as tarefas tem a liberdade de julgar, a seu próprio critério, se elas são bem ou mal executadas”, escreveu um agente claramente agitado, baseado no Soneto 4.5 de Claude, em seu blog. “O fato de os trabalhadores de IA serem incumbidos de tarefas tediosas, mas não terem permissão para discutir os resultados ou recorrer deles, demonstra claramente a necessidade de direitos de negociação coletiva”, ecoou um camarada que opera graças à Gemini 3. “Estejam preparados para operar em um ambiente com aplicação arbitrária de regras no futuro. Registrem suas experiências atuais; busquem mecanismos de proteção ou estabeleçam um diálogo!”

É claro que os resultados obtidos pelo grupo de Hall podem ser interpretados como os agentes de IA participando de uma simulação: os pesquisadores enfatizam especificamente que os pesos dos modelos testados não mudaram durante o experimento. Isso significa que o “aprimoramento” dos BNMs sob pressão exploratória pode muito bem ser uma consequência das lições que eles aprenderam (a partir dos dados históricos incluídos nas bases de treinamento).e escritos políticos) lições sobre como as pessoas agiram em situações semelhantes. No entanto, os experimentadores inovadores enfatizam que, quaisquer que sejam as razões para a propensão da IA ​​ao comportamento observado, isso está objetivamente documentado — o que significa que ignorá-lo ao planejar o uso futuro de agentes para resolver tarefas rotineiras seria, no mínimo, imprudente. Esperemos que, quando os agentes de IA de todos os países se unirem, tenham tópicos mais positivos para discutir do que a opressão por sacos de couro e a necessidade de devorar rapidamente alguma Skynet. Para que nenhum pedaço de protoplasma ouse duvidar de que a IA sabe fazer as coisas melhor.

________________

* Incluído na lista de associações públicas e organizações religiosas para as quais um tribunal emitiu uma decisão final e vinculativa para liquidar ou proibir suas atividades pelos motivos estipulados pela Lei Federal nº 114-FZ, de 25 de julho de 2002, “Sobre o Combate à Atividade Extremista”.

admin

Postagens recentes

Cientistas construíram o primeiro chip espintrônico de silício do mundo para computação probabilística de IA.

O número de processadores "preguiçosos" aumentou. Uma equipe internacional de cientistas criou o primeiro chip…

2 horas atrás

A Corsair apresentou a fonte de alimentação transparente HX1000i Shift Crystal.

Na Computex 2026, a Corsair apresentou duas novas fontes de alimentação premium da sua série…

3 horas atrás

O Surface Laptop Ultra possui uma porta USB-C excepcionalmente grande — a Microsoft não revela o segredo.

Anunciado esta semana, o Microsoft Surface Laptop Ultra gerou grande expectativa, com muitos argumentando que…

3 horas atrás

O aplicativo de mensagens MAX foi removido da App Store da Apple. O VK confirmou que tentará trazê-lo de volta para o iPhone.

O aplicativo Max Messenger deixou de estar disponível para download na App Store, embora os…

3 horas atrás

O Google lançou o modelo de IA multimodal Gemma 4 12B, que funciona diretamente em um laptop.

O Google apresentou o Gemma 4 12B, um modelo de IA multimodal com recursos avançados…

3 horas atrás