Um poderoso modelo de IA surgiu online, suspeito de ter sido desenvolvido pela DeepSeek.

Um poderoso modelo de IA sem atribuição, lançado recentemente na plataforma OpenRouter, gerou rumores de que a startup chinesa DeepSeek pode estar testando discretamente seu sistema de próxima geração antes do lançamento oficial. O modelo gratuito, chamado Hunter Alpha, apareceu no OpenRouter em 11 de março sem qualquer atribuição de desenvolvedor e foi posteriormente rotulado como um “modelo oculto” pela própria plataforma.

Durante testes conduzidos pela Reuters, o chatbot Hunter Alpha se descreveu como um modelo de IA chinês treinado principalmente em chinês e afirmou que seus dados de treinamento abrangiam até maio de 2025. Essa data de conhecimento coincide com a data relatada pelo próprio chatbot da DeepSeek. No entanto, quando questionado sobre o criador do sistema, recusou-se a identificar o desenvolvedor, afirmando que conhecia apenas seu nome, escala de parâmetros e comprimento da janela de contexto. Nem a DeepSeek nem o OpenRouter identificaram o criador do modelo ou responderam aos pedidos de comentários.

A página de perfil do Hunter Alpha revela suas impressionantes especificações técnicas: o modelo possui 1 trilhão de parâmetros, o que implica em altas demandas computacionais. Além disso, o sistema suporta uma janela de contexto de até 1 milhão de tokens, permitindo processar enormes volumes de texto em uma única sessão. O engenheiro de agentes de IA, Nabil Haouam, observou que a combinação de uma janela de 1 milhão de tokens, capacidades de raciocínio lógico e acesso gratuito é imediatamente impressionante, visto que modelos com classificação semelhante normalmente exigem custos de escalabilidade significativos.

Esses valores (1) são precisamente o que impulsiona este algoritmo.Um trilhão de parâmetros e um milhão de tokens de contexto estão associados ao próximo modelo DeepSeek V4, com lançamento previsto para abril. Essa coincidência gerou uma onda de rumores de que o Hunter Alpha pode ser uma versão de teste inicial do novo produto da startup chinesa. Uma análise do modelo, também conduzida pelo engenheiro Daniel Dewhurst, revelou que o sinal-chave pode ser o padrão de raciocínio. Segundo ele, o estilo de raciocínio lógico usado por um chatbot é muito difícil de falsificar e geralmente reflete o método de treinamento do modelo.

No entanto, nem todos compartilham dessa convicção. Umur Ozkul, após realizar um teste independente, afirmou que sua análise indica que o Hunter Alpha provavelmente não é o DeepSeek V4. Ele citou diferenças no comportamento relacionado a tokens e nos padrões arquitetônicos em comparação com os sistemas DeepSeek existentes.

Independentemente de sua autoria, o modelo rapidamente ganhou popularidade. De acordo com as estatísticas do OpenRouter, até domingo, ele havia processado mais de 160 bilhões de tokens. Grande parte dessa atividade veio de ferramentas e frameworks de desenvolvimento para agentes de IA. Vale ressaltar que a prática de executar modelos anonimamente não é incomum — é uma maneira comum de os desenvolvedores receberem feedback objetivo da comunidade.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Os investidores estão prontos para comprar ações da SpaceX no valor de mais de US$ 250 bilhões, quatro vezes o valor da oferta.

Até recentemente, um aumento de duas vezes no número de pessoas dispostas a comprar ações…

56 minutos atrás

A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software.

A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…

5 horas atrás

Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Segundo o Phoronix, a versão mais recente do driver gráfico Gallium3D R600, incluída no Mesa…

7 horas atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

7 horas atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

7 horas atrás