Categorias: Mercado de tecnologia e TI. notíciaNotícias da rede

OpenAI introduziu o modelo de linguagem pensante o1

A OpenAI introduziu um novo modelo de linguagem, o1, que tem a capacidade de raciocinar e resolver problemas de forma lógica. Ao contrário dos modelos anteriores, o1 é capaz de imitar o processo de pensamento humano, dividindo problemas complexos em etapas mais simples, analisando diferentes abordagens e corrigindo os seus próprios erros.

Fonte da imagem: OpenAI

O o1 Large Language Model (LLM) demonstrou excelente desempenho em testes e competições, comparável a especialistas humanos. Em programação, o1 ficou em 49º lugar na Olimpíada Internacional de Informática (IOI) de 2024 e venceu 89% das pessoas na plataforma Codeforces. Em matemática, o1 foi classificado entre os 500 melhores alunos dos Estados Unidos na fase de qualificação da American Mathematical Olympiad (AIME), demonstrando a capacidade de resolver problemas concebidos para os alunos mais talentosos, relata a OpenAI em seu site.

Fonte da imagem: OpenAI

Nas ciências naturais, o modelo superou médicos e candidatos a ciências no complexo teste GPQA diamante, que avalia conhecimentos nas áreas de química, física e biologia. “Isso não significa que o1 seja mais inteligente do que qualquer candidato à ciência”, explicam os desenvolvedores. “Isso sugere que o modelo é capaz de resolver alguns problemas ao nível de especialistas altamente qualificados.”

O modelo o1 também demonstrou superioridade sobre os modelos anteriores em vários testes de inteligência e resolução de problemas, incluindo o MMMU e o MMLU. De acordo com a OpenAI, o novo modelo supera significativamente o seu antecessor, GPT-4o, na maioria das tarefas de raciocínio. “Nossos testes mostraram que o o1 melhora consistentemente os resultados com quantidades crescentes de aprendizagem de intervenção e tempo gasto em reflexão”, observa a empresa. Em particular, nos testes AIME, o modelo o1 resolveu em média 83% dos problemas, enquanto o resultado GPT-4o foi de 13%.

O modelo o1 alucina significativamente menos que o GPT-4o. No entanto, é mais lento e mais caro. Além disso, o1 perde para o GPT-4o em conhecimento enciclopédico e não consegue processar páginas da web, arquivos e imagens. Além disso, o novo modelo pode manipular dados, ajustando a solução ao resultado.

O segredo do sucesso está em um algoritmo de aprendizagem fundamentalmente novo – a “cadeia de pensamentos”. O modelo pode melhorar esta cadeia aprendendo através do método de aprendizagem por reforço, graças ao qual reconhece e corrige seus erros, divide etapas complexas em etapas mais simples e tenta diferentes abordagens para resolver problemas. Esta metodologia melhora significativamente a capacidade de raciocínio do modelo, que “como um ser humano pode pensar durante muito tempo antes de responder a uma pergunta complexa”.

A OpenAI já lançou uma versão preliminar do modelo o1-preview, disponível para uso no ChatGPT e para desenvolvedores via API. A empresa admite que ainda há muito trabalho a ser feito para tornar o o1 tão fácil de usar quanto os modelos atuais. A segurança e a ética do novo modelo também são enfatizadas, pois seu raciocínio pode ser controlado, evitando comportamentos potencialmente indesejáveis. E antes de lançar o1-preview para uso público, a OpenAI conduziu testes de segurança.

O custo de usar o1-preview é de US$ 15 para 1 milhão de tokens de entrada e US$ 60 para 1 milhão de tokens de saída. Em comparação, o GPT-4o oferece um preço de US$ 5 por 1 milhão de tokens de entrada e US$ 15 por milhão de tokens de saída.

avalanche

Próximo Um McLaren P1 em tamanho real foi construído com 342.817 peças de LEGO e pode acelerar até 64 km/h »

Anterior « “Se existe um jogo que vai me fazer comprar um PS5 Pro, então é esse”: os jogadores ficaram impressionados com o novo trailer de Assassin’s Creed Shadows

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Programas

O criador de Claude Code revelou que lança milhares de agentes de IA todas as noites e os controla a partir de seu smartphone.

Boris Cherny, criador do Claude Code, disse que executa cerca de dois mil agentes de…

28 minutos atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

A Framework relatou uma estabilização nos preços da memória RAM, enquanto os SSDs agora estão ficando mais caros.

A Framework, fabricante de laptops modulares, trouxe boas e más notícias para seu público. A…

28 minutos atrás

Na vanguarda da ciência

A China está cada vez mais perto de criar seu próprio observatório de ondas gravitacionais no espaço.

Cientistas chineses testaram com sucesso o núcleo óptico do futuro observatório espacial de ondas gravitacionais…

28 minutos atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

A FCC autorizou a SpaceX a usar as frequências do EchoStar, mas exige uma caução de US$ 2,4 bilhões.

A Comissão Federal de Comunicações (FCC) dos EUA autorizou a SpaceX a usar o espectro…

53 minutos atrás

Jogos

Resident Evil Requiem garante à Capcom seu nono ano consecutivo de recordes de vendas, enquanto a editora aposta em inteligência artificial generativa.

A desenvolvedora e editora japonesa Capcom divulgou seus resultados para o último ano fiscal (encerrado…

1 hora atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

A Sony apresentou o smartphone Xperia 1 VIII, com um novo design, um conjunto triplo de câmeras de 48 megapixels com assistência de inteligência artificial e um preço inicial de € 1.499.

Os smartphones Xperia 1, carro-chefe da Sony, mantiveram praticamente o mesmo design desde 2020. Isso…

1 hora atrás

OpenAI introduziu o modelo de linguagem pensante o1

Conteúdo relacionado

Postagens recentes

O criador de Claude Code revelou que lança milhares de agentes de IA todas as noites e os controla a partir de seu smartphone.

A Framework relatou uma estabilização nos preços da memória RAM, enquanto os SSDs agora estão ficando mais caros.

A China está cada vez mais perto de criar seu próprio observatório de ondas gravitacionais no espaço.

A FCC autorizou a SpaceX a usar as frequências do EchoStar, mas exige uma caução de US$ 2,4 bilhões.

Resident Evil Requiem garante à Capcom seu nono ano consecutivo de recordes de vendas, enquanto a editora aposta em inteligência artificial generativa.

A Sony apresentou o smartphone Xperia 1 VIII, com um novo design, um conjunto triplo de câmeras de 48 megapixels com assistência de inteligência artificial e um preço inicial de € 1.499.