テクノロジーと科学の最新の話題を毎日配信中!!

Google、AI動画生成に革命か? Veo 3、Imagen 4、そして新ツール「Flow」でクリエイティブの未来を拓く

Y Kobayashi

2025年5月21日10:23AM

Googleは、開発者会議「Google I/O 2025」において、動画・画像生成AIモデルのアップデート、そしてそれらを統合する新たな制作ツール群を発表した。特に注目されるのは、音声生成まで可能になった動画モデル「Veo 3」、プロの要求に応えるアップデートが施された「Veo 2」、驚異的な品質と正確な文字表現を実現した画像モデル「Imagen 4」、そしてこれらの強力なAIを束ねる映像制作ツール「Flow」だ。これは、映像制作の常識を根底から覆し、クリエイターの表現力を飛躍的に向上させる可能性を秘めている。

スポンサーリンク

Google I/O 2025で示されたAIの新たな地平:創造性の民主化へ

今年のGoogle I/Oは、AIが単なる実験的技術から、実用的かつ高度なクリエイティブツールへと進化していることを明確に示した場と言えるだろう。Google DeepMindが開発を主導するこれらのモデル群は、同社のAI戦略において、創造性の「民主化」と「高度化」を両輪で推し進める意思の表れだ。これまで専門的な技術や高価な機材、そして多くの時間を要した映像・画像制作のハードルを劇的に下げ、より多くの人々が自らのアイデアを形にできる時代が到来しつつある。

動画生成AIの進化:Veo 3とVeo 2の強力アップデートが切り拓く表現の可能性

今回の発表で最も注目を集めたものの一つが、動画生成AI「Veo」ファミリーの進化だ。フラッグシップモデル「Veo 3」の登場と、既存の「Veo 2」への大幅な機能追加は、AIによる動画制作の可能性を新たな次元へと押し上げる。

Veo 3:音声生成も可能に、表現力が飛躍的に向上

「Veo 3」は、Googleの最新鋭動画生成モデルとして、その品質をVeo 2からさらに向上させただけでなく、特筆すべき新機能としてネイティブな音声生成能力を獲得した。これは単なるBGMの付加ではなく、映像の内容に合わせた環境音(例えば、街中のシーンにおける交通騒音や公園での鳥のさえずり)や、さらにはキャラクター間の会話まで生成できるというから驚きだ。

Veo 3 demo | Dialog

Googleによれば、Veo 3はテキストや画像からのプロンプト理解能力が大幅に向上しており、現実世界の物理法則をより正確に再現し、キャラクターの口の動きとセリフを同期させるリップシンクの精度も高い。ユーザーが短い物語をプロンプトとして入力すれば、Veo 3がそれを生き生きとした映像クリップとして生成してくれるという。これは、ストーリーテリングにおけるAIの役割を大きく変える可能性を秘めているのではないだろうか。

Veo 3は、まず米国にてGeminiアプリの「Google AI Ultra」プラン加入者向けに提供が開始され、AI映像制作ツール「Flow」(後述)や、エンタープライズ向けのVertex AIプラットフォームでも利用可能となる。

Veo 2アップデート:プロの要求に応える新機能群で、より高度な映像表現を

一方で、既に多くのクリエイターに利用されている「Veo 2」も、プロフェッショナルな映像制作現場からのフィードバックを元に、大幅な機能強化が図られた。

主な新機能は以下の通りだ。

  • 参照ベースの動画生成 (Reference powered video): ユーザーがキャラクター、シーン、オブジェクト、あるいは特定の画風を示す画像を参照として提供することで、生成される動画の一貫性とクリエイティブコントロールを格段に向上させる。これは、シリーズものの映像制作や、特定のブランドイメージを維持したい場合に極めて有効だろう。
  • カメラコントロール (Camera controls): カメラの回転、ドリー(移動撮影)、ズームといった動きを精密に指示できるようになった。これにより、映画的なカメラワークをAIで実現し、より意図した通りの映像表現が可能になる。
  • アウトペインティング (Outpainting): 生成された映像のフレームを拡張し、例えば縦長のポートレート動画を横長のランドスケープ動画に自然な形で変換できる。シーンの情報をAIがインテリジェントに補完するため、様々なスクリーンサイズへの対応が容易になる。
  • オブジェクトの追加・削除 (Object add and remove): 動画内の特定のオブジェクトを自然な形で追加したり、逆に消し去ったりすることができる。Veo 2は物体のスケール感、周囲との相互作用、影の落ち方などを理解し、違和感のない編集を実現するという。

これらの新機能のうち、参照ベース動画生成とカメラコントロールは、AI映像制作ツール「Flow」内で既に利用可能となっている。その他の機能も、数週間以内にVertex AI APIを通じて提供され、今後数ヶ月かけてGoogleの他の製品にも展開される予定だ。

スポンサーリンク

AI映像制作の統合ツール「Flow」登場:Veo, Imagen, Geminiの三位一体で創造性を解放

Veoシリーズの進化と並んで、今回の発表の目玉となったのが、新たなAI映像制作ツール「Flow」の登場だ。これは、単なる動画生成インターフェースではなく、Googleの誇る複数のAIモデルを統合し、よりシームレスで直感的な映像制作体験を提供することを目指している。

Introducing Flow | Google’s New AI Filmmaking Tool

Flowとは何か?Veo, Imagen, Geminiを束ねるクリエイティブ・ハブ

Flow」という名称は、クリエイターが創作に没頭し、時間が経つのも忘れてしまうような「フロー状態」からインスピレーションを得ているという。昨年Google Labsで実験的に公開された「VideoFX」の進化版と位置づけられ、まさにGoogle DeepMindの最先端AIモデル群――動画生成の「Veo」、画像生成の「Imagen」、そしてテキスト理解とプロンプト生成を支える「Gemini」――をカスタムデザインで統合した、唯一無二のツールと言えるだろう。

Flowの核心は、これらのAIモデルが有機的に連携することで生まれる相乗効果にある。ユーザーは自然言語(日常的な言葉)で作りたいショットのイメージをFlowに伝え、物語に必要な要素(キャラクター、場所、物体、画風など)を一元的に管理し、それらを組み合わせて美しいシーンを紡ぎ出すことができる。

Flowの主要機能:直感的な操作でシネマティックな映像を

Flowは、プロの映像制作者からAI映像制作の初心者まで、幅広いユーザーがその創造性を最大限に発揮できるよう、多彩な機能を備えている。

  • カメラコントロール: Veo 2のアップデートで紹介された、精密なカメラワークの指示が可能。
  • シーンビルダー (Scenebuilder): 既存のショットをシームレスに編集したり、拡張したりできる。例えば、あるシーンの続きをAIに生成させたり、異なるショット間をキャラクターや動きの一貫性を保ったまま繋いだりすることが可能だ。
  • アセット管理 (Asset Management): 生成した素材やプロンプト、参照画像などを効率的に管理・整理できる。
  • Flow TV: Veoで生成された優れたクリップやチャンネル、コンテンツを集めたショーケース。特筆すべきは、気に入った作例の正確なプロンプトやテクニックを確認できる点で、これは他のユーザーの創造的なプロセスから学び、自身のスキルアップに繋げるための非常に実践的な機能と言える。まさに、コミュニティベースでの学びと創造のサイクルを加速させる試みだ。

対象ユーザーと提供プラン:プレミアムユーザー向けに先行提供

Flowは、まず米国において、Googleの有料AIサービス「Google AI Pro」および「Google AI Ultra」プランの加入者向けに提供が開始される(その他の国・地域へも順次展開予定)。
「Google AI Pro」プランでは、Flowの主要機能と月間100回までの生成が可能。「Google AI Ultra」プランでは、より多くの生成上限に加え、前述のVeo 3による音声付き動画生成機能への早期アクセス権が付与される。

Googleは、Flowの開発にあたり、Dave Clark氏、Henry Daubrez氏、Junie Lau氏といった先鋭的なフィルムメーカーたちと緊密に連携してきた。彼らのフィードバックを製品に反映させることで、実際のクリエイティブワークフローに即したツールへと磨き上げている。このアプローチは、AI技術をクリエイターにとって真に役立つものにしようというGoogleの真摯な姿勢の表れだろう。

"Freelancers" by Dave Clark | Google I/O 2025 | Made with Flow

画像生成AIも深化:Imagen 4が実現する「驚異の品質」と「正確な文字表現」

動画生成AIの目覚ましい進化の一方で、画像生成AI「Imagen」も着実にその能力を高めている。最新モデル「Imagen 4」は、その品質と機能においても大きく進化している。

Imagen 4の特徴:細部描写とタイポグラフィの進化がもたらす表現力

Googleによれば、Imagen 4は「驚異的な品質」を実現しており、特に布地の複雑な織り目、水滴のリアルな描写、動物の毛の質感といった微細なディテールの再現性が格段に向上している。フォトリアリスティックなスタイルから抽象的なアートまで、幅広い表現に対応し、最大2Kの高解像度で、多様なアスペクト比の画像を生成できる。

しかし、Imagen 4の進化で特に注目すべきは、「スペルとタイポグラフィ(文字表現)」の大幅な改善だ。これまでの画像生成AIでは、画像内にテキストを正確に描写することが苦手とされてきた。Imagen 4ではこの点が大きく改良され、グリーティングカード、ポスター、さらにはコミックの吹き出しといった、テキストが重要な役割を果たすデザインの作成が格段に容易になるという。公開されたサンプル画像を見る限り、その実力は確かであり、クリエイティブの幅を大きく広げる可能性を秘めている。

提供プラットフォームと高速版への期待:より身近に、よりスピーディーに

Imagen 4は、Geminiアプリ、Googleの実験的プラットフォームWhiskVertex AIといった既存のチャネルに加え、Google WorkspaceのSlidesVidsDocsなど、日常的に使われるツール群にも統合され、本日より利用可能となっている。これにより、プレゼンテーション資料の図版作成や、文書への挿絵追加などが、より手軽かつ高品質に行えるようになるだろう。

さらにGoogleは、Imagen 3と比較して最大10倍高速に画像を生成できる「高速バリアント」を近日中にリリース予定であることも明らかにしている。これにより、アイデアの試行錯誤がより迅速に行えるようになり、クリエイティブプロセスの効率化が期待される。

スポンサーリンク

音楽生成AI Lyria 2の展開と責任あるAI開発への取り組み

今回の発表では、動画・画像生成AIに加え、音楽生成AI「Lyria 2」の展開についても触れられた。Lyria 2は、Google DeepMindが開発する高度な音楽生成モデルで、Music AI Sandboxを通じてミュージシャンやプロデューサーに実験的なツールを提供し、新たな音楽的アイデアの探求を支援している。YouTube ShortsやVertex AIでも利用可能だ。また、リアルタイムでインタラクティブに音楽を生成・操作できる「Lyria RealTime」(MusicFX DJの基盤技術)もAPIやAI Studioを通じて提供が開始され、音楽制作の新たな可能性を広げている。

そして、これらの強力な生成AIモデル群の発表と同時に、Googleは責任あるAI開発へのコミットメントも改めて強調した。AIによって生成されたコンテンツの透明性を確保するため、同社はデジタル透かし技術「SynthID」を開発・提供しており、これまでに100億以上の画像、動画、音声、テキストファイルに適用してきたという。Veo 3、Imagen 4、Lyria 2によって生成されるコンテンツにも、引き続きSynthIDによるウォーターマークが付与される。
さらに、AI生成コンテンツかどうかを一般ユーザーが確認できる検証ポータル「SynthID Detector」も新たにローンチされた。これは、AI技術の発展に伴う誤情報やディープフェイクといった問題への対策として、非常に重要な一歩と言えるだろう。

GoogleのAI戦略とクリエイティブ業界へのインパクト:新たなエコシステムの胎動

Googleが今回発表した一連のAIモデルとツール群は、同社のAI戦略における明確な方向性を示している。それは、高性能な基盤モデルを開発するだけでなく、それらを誰もが容易に活用できるアプリケーションやプラットフォームとして提供し、AIによる創造性のエコシステムを構築しようという野心的な試みだ。

これらのツールは、プロのクリエイターにとっては表現の幅を広げ、制作プロセスを効率化する強力な武器となるだろう。一方で、これまで専門知識やリソースの制約からクリエイティブな活動を諦めていた人々にとっては、アイデアを形にするための新たな扉を開くものとなるかもしれない。いわば、「創造性の民主化」が加速するのである。

OpenAIのSoraをはじめとする競合のAI動画生成ツールも注目を集めているが、GoogleはVeo、Imagen、Geminiという強力なモデル群を「Flow」というハブを通じて統合し、さらにWorkspaceのような既存の生産性ツールにも組み込むことで、独自の強みを発揮しようとしている。これは、単なる機能競争ではなく、ユーザー体験全体を重視したエコシステム戦略と言えるだろう。

もちろん、AIによるコンテンツ生成が急速に進化する中で、著作権、倫理、雇用の問題など、解決すべき課題も山積している。しかし、GoogleがSynthIDのような技術を通じて責任ある開発姿勢を示していることは評価できる。今後、クリエイティブ業界全体で、これらの新しいツールとどう向き合い、共存していくのか、建設的な議論が求められる。

AIは創造性の新たな起爆剤となるか、それとも…

Google I/O 2025で発表されたVeo 3、Veo 2アップデート、Imagen 4、そしてFlowは、AIがクリエイティブ分野にもたらす変革の序章に過ぎないのかもしれない。これらのツールは、私たちの想像力を刺激し、新たな物語を生み出すための強力な触媒となる可能性を秘めている。

しかし、その一方で、これらの技術が社会に与える影響については、慎重な議論と適切なルール形成が不可欠だ。Googleが示した「責任あるAI開発」の姿勢が、業界全体のスタンダードとなることを期待したい。

AIは果たして、人間の創造性を拡張する真のパートナーとなるのか、それとも予期せぬ課題を生み出すパンドラの箱なのか。その答えは、これからの私たちの選択と活用方法にかかっている。一つ確かなことは、テクノロジーの進化は止まらないということ。そして、その最前線で何が起きているのかを注視し続けることの重要性だ。今回のGoogleの発表は、まさにその思いを新たにするものだったと言えるだろう。


Sources

Follow Me !

\ この記事が気に入ったら是非フォローを! /

フォローする
スポンサーリンク

コメントする