KURAGE online | 人間 の情報

KURAGE online | 人間 の情報

OpenAIがAIの論文理解&再現能力を評価するベンチマーク「PaperBench」を発表 - GIGAZINE

投稿日:

... 人間よりも優れたパフォーマンスを示しましたが、24時間以上の長時間になると人間の方が優れていることがわかりました。学生8人の平均スコアは3論文関連キーワードはありません
S