KURAGE online | 人間 の情報 > OpenAIがAIの論文理解&再現能力を評価するベンチマーク「PaperBench」を発表 - GIGAZINE 投稿日:2025年4月3日 ... 人間よりも優れたパフォーマンスを示しましたが、24時間以上の長時間になると人間の方が優れていることがわかりました。学生8人の平均スコアは3論文関連キーワードはありません 続きを確認する