Tech Product

Gemma 4

Overview

Googleが提供するオープンな大規模言語モデルのシリーズ。最新世代では最大25万6000トークンのコンテキストウィンドウをサポートし、開発者が自身の環境で高度なAIエージェントを構築するための基盤として利用される。

Mentioned Articles

3 件

テクノロジー
Google、Gemma 4に12B Unifiedを追加：RAM 16GBのローカル環境で音声・画像エージェントを動かす布石

Googleは、中規模のオープンモデル「Gemma 4 12B Unified」を公開した。単一のデコーダーのみで音声・画像・テキストを直接処理する設計が特徴であり、16GB程度のメモリを持つPCで高度なマルチモーダルエージェントを構築できる。

2026年6月4日
テクノロジー
Google、Gemma 4向けに推論速度を最大3倍向上させるMTP(Multi-Token Prediction)ドラフトモデルを公開

Googleは、Gemma 4の推論を最大3倍高速化するMulti-Token Prediction対応ドラフトモデルを公開した。このモデルは、投機的デコード技術によりトークン生成と検証を分離し、VRAM帯域幅のボトルネックを解消することで、エッジデバイスやローカルPCでの推論品質を低下させることなく大幅に改善する。

2026年5月6日
テクノロジー
コンテキスト容量の20%を奪う見えない税金。Cloudflareが開発したAI向け外部記憶装置

Cloudflareは、大規模言語モデルのコンテキストウィンドウの限界と「コンテキストロット」問題に対処するため、AIエージェント向けマネージドサービス「Agent Memory」を発表した。このサービスは、会話データを外部に保存し必要な情報のみを抽出・検証・分類・取得する非同期ストレージと、タスクに応じて170億と1200億パラメータのモデルを使い分けることで、応答品質の劣化を防ぎつつ効率的な記憶管理を実現する。

2026年4月19日

External Mentions

10 件

arXiv How Transparent is DiffusionGemma?
▲ 0 Joshua Engels 2026年6月18日
arXiv Algebraic Dead Directions in LayerNorm Transformers: A Forward-Pass-Only Diagnostic at LLM Scale
▲ 0 Tejas Pradeep Shirodkar 2026年6月17日
arXiv Image Prompt Reconstruction Attacks on Distributed MLLM Inference Frameworks
▲ 0 Xinjian Luo 2026年6月17日
arXiv RepSelect: Robust LLM Unlearning via Representation Selectivity
▲ 0 Filip Sondej 2026年6月15日
arXiv Neither Parallel Nor Sequential: How DiffusionGemma Actually Commits Tokens
▲ 0 Ali Asaria 2026年6月12日
Hacker News Gemma 4 QAT models: Optimizing compression for mobile and laptop efficiency
▲ 236 theanonymousone 2026年6月5日
Hacker News Gemma 4 12B: A unified, encoder-free multimodal model
▲ 1045 rvz 2026年6月3日
Hacker News Indexing a year of video locally on a 2021 MacBook with Gemma4-31B (50GB swap)
▲ 471 asenna 2026年5月21日
Hacker News Accelerating Gemma 4: faster inference with multi-token prediction drafters
▲ 687 amrrs 2026年5月5日
Hacker News Show HN: Prompt-to-Excalidraw demo with Gemma 4 E2B in the browser (3.1GB)
▲ 163 teamchong 2026年4月19日

Gemma 4

Overview

Mentioned Articles

Google、Gemma 4に12B Unifiedを追加：RAM 16GBのローカル環境で音声・画像エージェントを動かす布石

Google、Gemma 4向けに推論速度を最大3倍向上させるMTP(Multi-Token Prediction)ドラフトモデルを公開

コンテキスト容量の20%を奪う見えない税金。Cloudflareが開発したAI向け外部記憶装置

External Mentions