Googleは、プレミアムAIサービス「Gemini Advanced」加入者向けに最新の動画生成AI「Veo 2」の提供を開始した。ユーザーはテキストプロンプトのみで8秒間の高品質動画を生成でき、物理法則に基づくリアルな動きと詳細な表現が特徴だ。
Googleが動画生成AI「Veo 2」をGemini Advancedで本格展開
Googleは、同社の最新AI動画生成モデル「Veo 2」をGemini Advancedの加入者向けに正式展開している。Veo 2は、テキストベースのプロンプトを動的な動画クリップに変換する技術で、昨年末に発表されたものだ。
Googleによると、Veo 2は以下の点で従来のモデルから大きく進化しているとされる。
- 高解像度と詳細描写: より精細で、現実に近い映像表現を目指している。
- 物理法則と人間動作の理解: 物体の動きや人間の自然な挙動を深く理解し、不自然さを低減。「流体的なキャラクターの動き、実物そっくりのシーン」を実現するという。
- 映画的リアリズム: 単なる動画生成に留まらず、「映画のようなリアリズム」を持つ映像を作り出すことを目標としている。
- 多様なスタイルへの対応: リアリズムからファンタジーまで、幅広い視覚スタイルに対応可能。
これらの特徴により、ユーザーは頭の中にあるアイデアや情景を、より忠実に、そして魅力的な動画として具現化できる可能性を秘めている。ただし、公開されている作例はGoogleが選んだものであり、実際の性能についてはユーザー自身による検証が待たれる部分もあるだろう。それでも、OpenAIの「Sora」などと並び、動画生成AI分野におけるGoogleの強力な一手となることは間違いない。
Gemini AdvancedでVeo 2を試す – テキストから8秒動画を作る方法
Google One AI プレミアムの加入者(月額2,900円)は、Web版およびモバイルアプリのGeminiからVeo 2を利用できる。ただし、展開は数週間かけて段階的に行われるため、実際に利用可能になるにはユーザーによっては時間がかかるかもしれない。
利用手順:
- モデル選択: Geminiインターフェース上部にあるモデル選択ドロップダウンメニューから「Veo 2」を選択する。このUIはまだ変更される可能性があるとGoogleが注記している点にも触れておきたい。
- プロンプト入力: 作成したい動画の内容をテキストで詳細に記述する。Googleは「説明が詳細であるほど、最終的な動画の制御性が高まる」と述べている。プロンプトには、シーンの内容だけでなく、視覚スタイル(例:アニメ風、写実的)、ショットのフレーミング、シミュレートするカメラレンズの種類なども含めることができる。
- 生成: プロンプトを入力すると、Veo 2が動画生成を開始する。生成には1~2分程度かかるとされている。
出力仕様:
- 動画の長さ: 8秒
- 解像度: 720p ※Veo 2自体はより高解像度(4Kなど)な出力も可能とされるが、現時点でのGemini実装では720pに制限されている。
- アスペクト比: 16:9(横長)
- ファイル形式: MP4
- 共有: 生成された動画はダウンロード可能。モバイルアプリからは、共有ボタンをタップすることでTikTokやYouTube Shortsなどのプラットフォームに直接アップロードできる。
この機能は、短いビジュアルストーリーの作成、コンセプトの視覚化、あるいは非現実的な組み合わせを想像して楽しむなど、創造的な可能性を大きく広げるものだ。
画像から動画へ – Whisk AnimateとVeo 2の連携
Veo 2の能力は、テキストからの動画生成だけに留まらない。Googleは、実験的なAIツールプラットフォーム「Google Labs」で提供されている「Whisk」にもVeo 2を統合した。
Whiskは、テキストプロンプトと参照画像を組み合わせて新しい画像を生成するツールとして昨年12月に登場した。今回、新たに「Whisk Animate」機能が追加され、Whiskで生成した画像、あるいはテキストと画像を基にして、Veo 2による8秒間のアニメーション動画を作成できるようになった。
Whisk Animateは、Google One AI プレミアム加入者(Gemini Advancedと同じプラン)がGoogle Labsを通じて利用可能だ。静止画に命を吹き込みたいと考えるクリエイターにとって、興味深い選択肢となるだろう。
利用上の注意点 – 月間制限とロールアウト状況
動画生成は計算リソースを大量に消費するため、GoogleはVeo 2の利用にいくつかの制限を設けている。
- 月間生成数制限: Gemini AdvancedおよびWhisk AnimateでのVeo 2利用には、月間の生成数に上限がある。具体的な上限数は公開されていないが、制限に近づくとユーザーに通知される仕組みだ。Whiskでの制限が月間100本であるとの情報もあり、Gemini Advancedでも同程度の可能性があると推測されるが、これは現時点では未確認情報である。
- 段階的ロールアウト: Gemini AdvancedでのVeo 2機能は、本日より全世界で順次提供が開始されるが、全ての対象ユーザーに行き渡るまでには数週間かかる可能性がある。Google製品の機能ロールアウトは、時に予想以上に時間がかかることがある。過去のGemini Live機能の展開に約1ヶ月かかった例もある。
- 対象外プラン: 現時点では、Google Workspaceのビジネスプランや教育プランでは利用できない。
利用を検討しているユーザーは、これらの制限とロールアウト状況を念頭に置く必要がある。
安全性と透明性への取り組み – SynthIDによるAI生成明示
AIによる生成コンテンツ、特にリアルな動画は、誤情報拡散などのリスクも伴う。GoogleはVeo 2の安全性確保に配慮していると強調している。
- SynthID: Veo 2で生成された動画の各フレームには、「SynthID」と呼ばれる電子透かしが埋め込まれる。これは、人間の目には見えない形で、コンテンツがAIによって生成されたことを示す技術だ。これにより、AI生成コンテンツの識別と透明性向上を図る。ただし、これが一般ユーザーの誤認を完全に防ぐ保証はない。
- ポリシーと評価: Googleは、不適切または有害なコンテンツ(ポリシー違反)の生成を防ぐため、広範なテスト(レッドチーミング)や評価を実施している。
Googleは、ユーザーからのフィードバック(高評価/低評価ボタン)を通じて、継続的に改善を行う姿勢を示している。
競争激化する動画生成AI – Sora、Runwayとの比較と業界への影響
GoogleによるVeo 2の一般提供は、急速に進化する動画生成AI分野における競争の激化を象徴している。
- 競合: OpenAIが発表し、大きな注目を集めた「Sora」や、既に多くのクリエイターに利用され、最近バージョン4をリリースしたRunwayなどが主要な競合となる。各社がモデルの性能向上と機能拡充を競い合っている状況だ。
- 業界への影響: 高度な動画生成AIの登場は、映像制作やアニメーションといったクリエイティブ業界に大きな影響を与える可能性が指摘されている。ハリウッドのアニメーターや漫画家を代表する労働組合「アニメーション・ギルド」が委託した調査結果では、2026年までに米国の映画、テレビ、アニメーション関連の雇用10万件以上がAIによって混乱にさらされる可能性があると推定されている。
Veo 2のようなツールがもたらす創造性の向上と、既存の産業構造や雇用への影響については、今後も注視していく必要がある。
GoogleのAI戦略とVeo 2の将来性
Veo 2の展開は、Googleの広範なAI戦略の一部と見ることができる。Google DeepMindのCEOであるデミス・ハッサビス氏は、将来的にはGeminiモデルとVeoを組み合わせることで、Geminiの物理世界に対する理解力を向上させる計画があると言及している。これは、AIが現実世界をより深く認識し、対話できるようになる可能性を示唆している。
現時点でのVeo 2は、動画の長さ(8秒)や解像度(720p)に制限があるが、今後のアップデートでこれらの制限が緩和され、さらに高度な機能が追加されることが期待される。GoogleがGemini Advancedという有料プランの目玉機能としてVeo 2を位置づけていることからも、同社がこの技術に大きな期待を寄せていることがうかがえる。
「Gemini Veo 2」の登場は、AIによるコンテンツ制作の新時代の幕開けを告げる出来事の一つと言えるだろう。
Sources