テクノロジー
Google、Gemma 4に12B Unifiedを追加:RAM 16GBのローカル環境で音声・画像エージェントを動かす布石
Googleは、中規模のオープンモデル「Gemma 4 12B Unified」を公開した。単一のデコーダーのみで音声・画像・テキストを直接処理する設計が特徴であり、16GB程度のメモリを持つPCで高度なマルチモーダルエージェントを構築できる。
Googleが提供するオープンな大規模言語モデルのシリーズ。最新世代では最大25万6000トークンのコンテキストウィンドウをサポートし、開発者が自身の環境で高度なAIエージェントを構築するための基盤として利用される。
Googleは、中規模のオープンモデル「Gemma 4 12B Unified」を公開した。単一のデコーダーのみで音声・画像・テキストを直接処理する設計が特徴であり、16GB程度のメモリを持つPCで高度なマルチモーダルエージェントを構築できる。
Googleは、Gemma 4の推論を最大3倍高速化するMulti-Token Prediction対応ドラフトモデルを公開した。このモデルは、投機的デコード技術によりトークン生成と検証を分離し、VRAM帯域幅のボトルネックを解消することで、エッジデバイスやローカルPCでの推論品質を低下させることなく大幅に改善する。
Cloudflareは、大規模言語モデルのコンテキストウィンドウの限界と「コンテキストロット」問題に対処するため、AIエージェント向けマネージドサービス「Agent Memory」を発表した。このサービスは、会話データを外部に保存し必要な情報のみを抽出・検証・分類・取得する非同期ストレージと、タスクに応じて170億と1200億パラメータのモデルを使い分けることで、応答品質の劣化を防ぎつつ効率的な記憶管理を実現する。