Grok 4.1、ベンチマークランキングで競合を抑え新たなAIリーダーに – biggo.jp 2025年11月19日2025年11月19日ai Elon Musk氏の xAI が、同社のAIチャットボット「Grok 4.1」の大幅なアップデートを、Web、iOS、Androidプラットフォームで無料公開しました。このリリースは、競争の激しいA...
Lakera、AIエージェント向けLLMセキュリティベンチマーク公開 – oneword.co.jp 2025年10月29日2025年10月30日ai LakeraがAIエージェント向けオープンソースセキュリティベンチマークを公開 LLMバックエンドの脆弱性評価
サムスン電子が独自開発したAI業務生産性ベンチマーク「トゥルーベンチ(TRUEBench、Trustworthy Real-world Usage Evaluation Benchmark)」を公開し.. – 매일경제 2025年9月25日2025年9月25日ai サムスン電子が独自開発したAI業務生産性ベンチマーク「トゥルーベンチ(TRUEBench、Trustworthy Real-world Usage Evaluation Benchmark)」を公開し...
中国VC、実用性重視のAI ベンチマークを一部無料公開 – MITテクノロジーレビュー 2025年7月1日2025年7月19日ai 中国のベンチャーキャピタル企業は、AIモデルの学術的な能力だけでなく、実世界のタスクを遂行する能力について評価できるベンチマークテストを作成した。一部は無料で公開され、定期的に更新される予定だ。
AtCoder×Sakana AI、AIによる組合せ最適化問題開発に対応するベンチマーク「ALE-Bench」 – マイナビニュース 2025年6月18日2025年7月19日ai AtCoderは6月18日、Sakana AIと共同でAIによるアルゴリズム開発能力を評価する新たなベンチマーク「ALE-Bench」を開発したことを発表した。
新しい量子最適化ベンチマーク・ライブラリを使ってアルゴリズムをテストしてみませんか – IBM 2025年6月7日2025年7月19日ai 最適化における量子優位性を実現するためには広い範囲の古典アルゴリズムと量子アルゴリズムを公正に評価することが必要です。そのために開発されたオープンソースのベンチマークQOBLIBと、その役割について書...
【モンハンワイルズ】ベンチマークのスコア結果と目安【モンスターハンターワイルズ】 – GameWith 2025年5月5日2025年7月18日ai モンハンワイルズのベンチマークのスコア結果と目安です。モンハンワイルズベンチマークがクラッシュする(落ちる)時の対処法やダウンロード方法、やり方や設定方法を掲載。ベンチマークの結果を参考にして下さい。
Smooth MotionでGeForce RTX 5070 TiはRTX 4080を完全撃破 – ニコニコニュース 2025年2月27日2025年7月16日ai 【元記事をASCII.jpで読む】 2025年2月20日より、「GeForce RTX 5070 Ti」(以下、RTX 5070 Ti)の販売が解禁された。RTX 5090騒動を受け、どの...