GEPA: um novo paradigma para otimização de prompts que supera o Reinforcement Learning 03/08/2025 Nenhum comentário Read More »
Geometric-Mean Policy Optimization (GMPO): Um Novo Passo para Otimizar a Estabilidade e o Raciocínio em LLMs 03/08/2025 Nenhum comentário Read More »
Self-MoA: Quando Misturar Modelos de IA Pode Ser uma Má Ideia 13/02/2025 Nenhum comentário Read More »
Underthinking em Modelos de Linguagem: Um Desafio para o Raciocínio Profundo da IA 08/02/2025 Nenhum comentário Read More »