GEPA: um novo paradigma para otimização de prompts que supera o Reinforcement Learning 24/03/2026 Acessar Conteúdo »
Geometric-Mean Policy Optimization (GMPO): Um Novo Passo para Otimizar a Estabilidade e o Raciocínio em LLMs 24/03/2026 Acessar Conteúdo »