Open Agent Leaderboard : Benchmark pour agents IA
Open Agent Leaderboard propose un cadre d'évaluation ouvert pour comparer les systèmes d'agents IA, mesurant à la fois la qualité et le coût. Il utilise six benchmarks pour tester des tâches réalistes comme le codage et le service client.