KVCached発表:共有GPU環境でLLM推論を効率化する仮想化技術 – oneword.co.jp 2025年10月27日2025年10月27日ai KVCachedが共有GPU環境でのLLM推論効率化を実現 仮想化技術により複数ユーザーでのリソース共有が可能