Google、Gemma 4に12B Unifiedを追加:RAM 16GBのローカル環境で音声・画像エージェントを動かす布石
Googleは、中規模のオープンモデル「Gemma 4 12B Unified」を公開した。単一のデコーダーのみで音声・画像・テキストを直接処理する設計が特徴であり、16GB程度のメモリを持つPCで高度なマルチモーダルエージェントを構築できる。
オープンソースのAIコミュニティを牽引するプラットフォーム。NVIDIAはAlpamayo 1のモデルウェイトをこのプラットフォーム上で公開しています。
Googleは、中規模のオープンモデル「Gemma 4 12B Unified」を公開した。単一のデコーダーのみで音声・画像・テキストを直接処理する設計が特徴であり、16GB程度のメモリを持つPCで高度なマルチモーダルエージェントを構築できる。
Googleは、Gemma 4の推論を最大3倍高速化するMulti-Token Prediction対応ドラフトモデルを公開した。このモデルは、投機的デコード技術によりトークン生成と検証を分離し、VRAM帯域幅のボトルネックを解消することで、エッジデバイスやローカルPCでの推論品質を低下させることなく大幅に改善する。
DeepSeek-AIは、100万トークンのコンテキスト長を持つDeepSeek-V4シリーズのプレビュー版を公開した。DeepSeek-V4-ProとDeepSeek-V4-Flashは、それぞれ1.6兆と2840億のパラメータを持つMixture-of-Expertsモデルであり、長文推論のコスト効率を大幅に改善した。特に、Compressed Sparse AttentionとHeavily Compressed Attentionを組み合わせたハイブリッド注意機構により、1トークン推論FLOPsとKVキャッシュを大幅に削減し、大規模言語モデルの運用コスト低減に貢献する。
OpenAIは、テキスト中の個人識別情報(PII)をローカルで検出・マスクする「OpenAI Privacy Filter」を公開した。Apache 2.0ライセンスで提供され、クラウドに送る前のデータ処理に活用できるが、匿名化ツールや法令順守の証明にはならないため、高リスク用途での利用には注意が必要だ。
2026年2月11日、北京。中国のAIスタートアップの筆頭格であるZhipu AI(智譜AI、旧称:Knowledge Atlas Technology)は、最新の旗艦基盤モデル「GLM-5」を発表した。春節(旧正月)を […]
Googleの研究部門であるGoogle DeepMindおよびGoogle Translate Research Teamは2026年1月15日、最新のオープンモデル「TranslateGemma」を発表した。これは、 […]
2026年は「フィジカルAI」に関する動きが本格化しそうだ。 CES 2026において、AIコンピューティングの巨人NVIDIAは、自動運転開発のための包括的なオープンプラットフォーム「NVIDIA Alpamayo」フ […]
2025年、生成AIの競争軸は「流暢な会話」から「論理的な推論」へと完全に移行した。その最前線で、中国のAIスタートアップDeepSeekがまたしても業界を揺るがす一手、「DeepSeekMath-V2」を投じた。 これ […]
AI業界を覆っていた熱狂の霧が、急速に晴れようとしている。その中心にいるのは、他ならぬOpenAIのCEO、Sam Altman氏その人だ。彼が自ら「我々はバブルの中にいる」と認めたことは、業界全体に衝撃を与えている。時 […]
NVIDIAは、中国DeepSeek社の巨大推論モデル「DeepSeek R1 0528」の知性を、より小型で効率的なモデル群に凝縮した「OpenReasoning-Nemotron」ファミリーをオープンソースとして公開 […]
北京人工知能研究所(BAAI)が、オープンソースの次世代マルチモーダルAI「OmniGen2」を公開した。テキストと画像を自在に操るその性能は、一部でOpenAIのGPT-4oに匹敵すると評価され、さらに「自己反省」能力 […]
フランスのAIスタートアップMistral AIが、新たなオープンソースLLM(大規模言語モデル)「Devstral」を公開した。240億パラメータという、近年の巨大モデルと比較すると軽量な設計でありながら、主要なソフト […]
サンフランシスコの新興企業Deep Cogitoが、ステルスモードを解除し、高性能なオープンソースAIモデル群「Cogito v1」を発表した。独自のIDA訓練手法とハイブリッド推論機能を備え、既存のLlamaやDeep […]
フランスのAIスタートアップMistral AIが、わずか24B(240億)パラメータながらGoogle GemmaやOpenAIのGPT-4o miniを上回る性能を持つ新モデル「Mistral Small 3.1」を […]
OpenAIの「Deep Research」は、人間の専門家なら何時間もかかる作業を数分で完了すると約束する、最新の人工知能(AI)ツールである。 ChatGPT Proの機能として組み込まれ、訓練された分析者に匹敵する […]
国内AIソリューション企業AIdeaLabは、日本初となる商用利用可能な日本語動画生成AI基盤モデル「AIdeaLab VideoJP」を無償で公開した。同モデルは、経済産業省とNEDOが実施する国内生成AI開発力強化プ […]
OpenAIの次世代AI動画生成モデル「Sora」が、テスターとして参加していたアーティストグループによってリークされる事態が発生した。このグループは、OpenAIによる無償の研究開発とPR活動への利用に抗議する形で、公 […]
Stability AIは、テキストから画像を生成するAIモデル「Stable Diffusion」の最新バージョンとなる「Stable Diffusion 3.5」を発表した。今回のリリースでは、異なる用途に特化した3 […]
Stability AIは先日Computexにて、Stable Diffusion 3 Mediumのリリースを予告していたが、本日予告通りにこれをリリースした。 画像生成のための新たなオープンウェイトモデル「SD3 […]