AI性能評価の業界標準に疑義 – 日経クロステック 2025年6月11日2025年7月19日ai 大規模言語モデル(LLM)の性能評価における事実上の業界標準システム「Chatbot Arena」。このランキングシステムに重大な問題があるとカナダのコーヒアなどが発表し、反響を呼んだ。この研究論文「...
Archaic、日本語特化型RAGシステムAI 開発、性能評価を公開 – PR TIMES 2025年6月9日2025年7月19日ai 株式会社Archaicのプレスリリース(2025年6月9日 10時30分)Archaic、日本語特化型RAGシステムAI 開発、性能評価を公開