AI評価基準 – omake AIメディア

2025年11月17日2025年11月17日ai

「忖度なし」独立系評価の決定版、Artificial Analysisの独立性AIモデルの性能を測る指標は数多く存在するが、その評価が本当に信頼できるかどうかは別問題だ。開発元の企業が自社モデルの優位...

2025年9月28日2025年9月28日ai

動画「人工知能の指標としてのJQあるいはCQ」にて、脳科学者・茂木健一郎氏が、AI時代に求められる知性の新たな指標について自身の見解を示した。茂木氏は、人工知能が飛躍的な進化を遂げる中、「何を計算させ...

2025年4月13日2025年7月18日ai

最近、生成型人工知能(AI)モデルの性能を計る指標である「ベンチマーク」を巡る論難が激しくなっている。メタ、xAI主要AI企業が相次いでベンチマーク操作疑惑に巻き込まれ、評価基準の公正性を巡る論争が...