AI-Papers
OpenAI、SWE-bench Verified評価を廃止 — ベンチマーク汚染問題を公式認定 | AI-Papers