OpenAI o1
O novo modelo de inteligência artificial capaz de lidar com tarefas complexas e resolver problemas mais difíceis com mais eficácia do que seus antecessores em áreas como ciência, programação e matemática. Crédito: Varavin88/Bigstock.
A OpenAI anunciou, na quinta-feira (12), o lançamento do o1, novo modelo de inteligência artificial capaz de lidar com tarefas complexas e resolver problemas mais difíceis com mais eficácia do que seus antecessores em áreas como ciência, programação e matemática, conforme informado pela empresa em seu blog.
O o1 se destaca por sua capacidade de raciocínio avançado, segundo a empresa. Ele pode simular uma cadeia de pensamento, redefinindo as respostas ao longo de várias etapas.
O novo modelo foi treinado para quebrar questões difíceis em partes menores, corrigir seus próprios erros e explorar diversas soluções antes de chegar à resposta final. Essa abordagem permite que o modelo supere as limitações observadas em outros sistemas, como o ChatGPT tradicional, especialmente em áreas que exigem lógica profunda e análise crítica.
Com desempenho superior em matemática e ciências, o o1 atinge resultados acima do esperado em relação aos outros modelos. Em seu blog, a OpenAI revela que em um exame de qualificação para a Olimpíada Internacional de Matemática (IMO), o GPT-4o acertou apenas 13% das questões, enquanto o novo modelo de raciocínio conseguiu resolver 83% das perguntas corretamente.
Além disso, quando testado em competições de programação, o modelo alcançou um desempenho acima do esperado, ficando entre os 11% melhores participantes em eventos do Codeforces, plataforma online que organiza competições de programação e oferece uma ampla variedade de problemas de codificação para resolver.
Em áreas como biologia, química e física, o modelo também demonstrou habilidades comparáveis às de especialistas humanos.
Uma das inovações do o1 é seu processo de refinamento contínuo. No entanto, apesar de suas capacidades avançadas, o o1 ainda não possui alguns dos recursos práticos encontrados no GPT-4o, como a navegação na web e o suporte para arquivos e imagens. Porém, como informa a empresa, para tarefas que exigem raciocínio complexo, o o1 representa um avanço significativo.
A OpenAI também destacou aprimoramentos na segurança do novo modelo. Com uma nova abordagem de treinamento voltada para a proteção, o o1 é mais eficiente em seguir diretrizes de conformidade e evitar brechas conhecidas como jailbreaking (prática de manipular modelos de IA para que ele ignore ou contorne suas diretrizes de segurança e controle, permitindo respostas ou comportamentos indesejados). Em testes rigorosos, segundo a empresa, o o1 obteve uma pontuação de 84 em uma escala de 0 a 100, em comparação com 22 do GPT-4o.
Atualmente, o modelo o1 está em fase de testes limitados e disponível apenas para um grupo selecionado de usuários. Mesmo aqueles que possuem acesso ao ChatGPT Plus, a versão paga do ChatGPT, ainda não têm acesso generalizado a ele. A OpenAI está utilizando essa fase para refinar o modelo antes de expandir sua disponibilidade, o que deve ocorrer à medida que os testes evoluam e os resultados se consolidem.
Com o lançamento do o1, a OpenAI pretende não apenas ampliar as capacidades de suas IAs, mas também eleva o patamar do que é possível em termos de raciocínio artificial. À medida que mais usuários tenham acesso ao modelo, espera-se que ele redefina a maneira como desafios técnicos são enfrentados.
As mais lidas da semana