AIの性能評価操作をめぐる議論が相次ぎ、有利な基準だけを公開···現実性不足の指摘も「統一された基準は事実上難しい」 – 매일경제 2025年4月13日2025年7月18日ai 最近、生成型人工知能(AI)モデルの性能を計る指標である「ベンチマーク」を巡る論難が激しくなっている。 メタ、xAI主要AI企業が相次いでベンチマーク操作疑惑に巻き込まれ、評価基準の公正性を巡る論争が...