タグ: 言語モデル
AIモデル「Llama 3.3 Swallow」、東京科学大などのチームが公開 日本語能力は「GPT-4oに迫る」 – ITmedia
東京科学大学情報理工学院の岡崎研究室と横田研究室、産業技術総合研究所の研究チームは、大規模言語モデル(LLM)「Llama 3.3 Swallow」を開発したと発表した。
ノイズから単語を抽出して爆速なコード生成が可能な拡散型の言語モデル「Mercury Coder」 – GIGAZINE(ギガジン)
AI開発企業のInceptionが、一般的なAIモデルよりも最大10倍高速なテキスト生成が可能な大規模言語モデル「Mercury Coder」をリリースしました。
OpenAIが最新モデル「GPT4.5」発表、思慮深い人と話しているように – Forbes JAPAN
人工知能(AI)大手の米OpenAIは2月27日、会話に特化した生成AIの新たなモデル「GPT4.5」を発表した。同社のサム・アルトマンCEOは、「巨大」で「高価」なこのモデルとの会話が、「思慮深い人...
【詳報】GPT-4.5の特徴は? 教師なし学習で性能向上、OpenAI史上最大サイズ、API利用は超高価 – ITmedia
米OpenAIは2月28日(日本時間)、同社の大規模言語モデル「GPT-4.5」の研究プレビューを公開した。このモデルはGPT-4oをベースに構築されており、学習方法などを工夫することで“長考”をしな...
今のLLMは長文が苦手な「鳥頭」 ディープシーク登場の真の意味 – ITpro
大規模言語モデル(LLM)をはじめとする生成AI(人工知能)の開発が大きな転換点に来ていることをひしひしと感じている。そのきっかけが「ディープシーク・ショック」だ。
特定対象に注意する「Attention」 自然言語処理の精度上げた立役者 – ITpro
機械翻訳のニューラルネットワークは、2つのRNNを前後につなげた構造を取る。翻訳元の意味を理解するエンコーダーと、翻訳先の文章を組み立てるデコーダーだ。ただしTransformerではRNNではなく、...
(プレスリリース)【JAPAN AI】AIサービスに最新LLM「Claude 3.7 Sonnet」を実装 – ニフティニュース
JAPAN AI株式会社(本社:東京都新宿区、代表取締役社長:工藤 智昭、以下JAPAN AI)は、提供しているAIサービスに、Anthropic PBC(本社:アメリカ合衆国カリフォルニア州、CEO...
ChatGPTの利用者が全人類の5%に GPT4.5、GPT5の提供もそろそろ – ITmedia エンタープライズ
OpenAIのCOO、ブラッド・ライトキャップ氏は、ChatGPTの週間アクティブユーザーが4億人を超えたと報告。GPT-4.5とGPT-5の導入計画も発表した。
Anthropic、「Claude 3.7 Sonnet」公開 「o1」を大きく上回るコーディング性能 – ITmedia
米Anthropicは、ハイブリッド推論モデル「Claude 3.7 Sonnet」を発表した。
単一のAIモデルで200言語を翻訳: 高品質な機械翻訳についてのアップデート – Meta Store
Meta AIは、単一のAIモデルとして初めて200の言語を翻訳できる「NLLB-200」を開発しました。これまでにない品質の高さは、言語ごとの詳細な評価によって実証されています。 また、新たな評価デ...








