生成AIが「自己改善」する!Metaの事前学習に強化学習を組み込むLLM開発とは【話題の最新論文】 – ロボスタ 2026年2月12日2026年2月12日ai 【事前学習に強化学習を組み込む「自己改善型」LLM開発】大規模言語モデル(LLM)の開発現場では、事前学習で獲得した膨大な知識を、ファインチューニングやアライメントと呼ばれる後工程で「安全」かつ「正確...