画像生成AIの世界で、その独特の美的センスとクオリティで不動の地位を築いてきたMidjourneyが、ついに新たな領域へと舵を切った。2025年6月18日(米国時間)、同社は待望のAI動画生成モデル「V1」を正式にリリースした。この動きは、すでに熾烈な競争が繰り広げられているAI動画市場に巨大なインパクトを与えると同時に、同社が直面する法的な嵐の中で、その真の野望を浮き彫りにするものでもある。
Midjourney、待望のAI動画生成モデル「V1」を正式リリース
多くのクリエイターやAI愛好家が待ち望んでいた瞬間がついに訪れた。Midjourneyは公式サイトで「V1 Video Model」のリリースを発表。これは同社にとって、静止画生成からマルチメディアコンテンツ制作へと向かう、極めて重要な一歩となる。
MidjourneyのCEOであるDavid Holz氏は、このリリースが単なる新機能の追加ではないことを強調する。彼の言葉を借りれば、動画モデルは、同社が最終目標として掲げる「リアルタイムのオープンワールド・シミュレーション」を実現するための、必要不可欠な「ビルディングブロック(構成要素)」の一つなのだ。
この壮大なビジョンは、画像、動画、3D、そしてリアルタイムレンダリングを統合し、ユーザーがAIによって生成された世界を自由に探索し、インタラクトできる未来を描いている。今回のV1は、その壮大な物語の序章に過ぎないのかもしれない。
「V1」の核心機能:静止画に生命を吹き込む「Image-to-Video」
V1のワークフローは、Midjourneyの既存ユーザーにとって非常に直感的だ。「Image-to-Video」と名付けられたこの機能は、その名の通り、一枚の画像から動画を生成するアプローチを採用している。
シンプルな操作性:「Animate」ボタン一つの手軽さ
ユーザーはMidjourneyのWebインターフェース上で、自身が生成した画像、あるいは外部からアップロードした画像の下に表示される「Animate」ボタンを押すだけだ。これにより、誰でも簡単に静止画を5秒間の短いアニメーションクリップに変換できる。

操作モードは2種類用意されている。
- 自動モード(Automatic): システムが画像の文脈を解釈し、最適な動きを自動で生成する。手軽に予期せぬ面白い結果を得たい場合に最適だ。
- 手動モード(Manual): ユーザーがテキストプロンプトで「被写体がどのように動くか」「カメラがどう動くか」などを具体的に指示できる。より意図に沿ったアニメーション制作が可能となる。
動きを操る「モーション設定」と「延長機能」
それぞれの操作モードには、アニメーションの質をコントロールするため、2つのモーション設定が提供される。
- Low motion: 風にそよぐ木々やキャラクターの瞬きなど、背景がほぼ固定された状態での繊細な動きの表現に適している。ただし、動きがほとんどないクリップが生成されることもある。
- High motion: 被写体とカメラの両方がダイナミックに動くシーン向け。迫力ある映像が期待できる一方、予期せぬ破綻(アーティファクト)が生じる可能性も高まる。
生成された5秒の動画は、気に入ればさらに延長することが可能だ。1回につき約4秒ずつ、最大4回まで延長でき、合計で約21秒のクリップを作成できる。
外部画像にも対応する柔軟性
特筆すべきは、Midjourneyで生成した画像だけでなく、ユーザーが保有するあらゆる画像をアップロードし、アニメーション化できる点だ。思い出の写真や自作のイラストに動きを与えるといった、新たなクリエイティブの可能性を広げる機能と言えるだろう。
圧倒的コストパフォーマンス?「V1」の料金体系を競合と比較
MidjourneyはV1のコンセプトとして「楽しく、簡単で、美しく、そして手頃であること」を掲げている。その価格設定は、このコンセプトを強力に裏付けるものとなっている。
画像生成8回分=動画1ジョブの衝撃
V1のビデオジョブ1回あたりのコストは、画像生成(/imagine)の約8倍に設定されている。一見すると高価に感じるかもしれないが、1回のジョブで4種類の異なる5秒動画が生成される点を考慮する必要がある。

計算すると、合計20秒の動画が画像8枚分のコストで手に入るため、動画1秒あたりのコストは画像1枚のアップスケールとほぼ同等となる。Midjourney自身も「市場がこれまでに提供してきたものより25倍以上安い」と主張しており、その価格破壊力は驚異的だ。
利用は月額10ドルのBasicプランから可能。月額60ドル以上のProプラン加入者は、処理速度が遅くなる代わりにGPU時間を消費しない「Relax Mode」での動画生成もテスト的に利用できる。
主要AI動画サービスとの価格比較
この価格設定がどれほど破壊的か、主要な競合サービスと比較してみよう。
AI動画モデル | 企業 | 月額基本料金(目安) |
---|---|---|
Midjourney V1 | Midjourney | $10 |
Pika 2.2 | Pika Labs | $10 |
Luma Dream Machine | Luma Labs | $9.99 |
Runway Gen-4 | Runway | $12 (Standard) |
OpenAI Sora | OpenAI | $20 (ChatGPT Plus経由) |
Adobe Firefly Video | Adobe | $9.99 (Standard) |
Google Veo 3 | $249.99 (AI Ultra経由) |
注:料金やプラン内容は変更される可能性があります。各サービスの公式サイトで最新情報をご確認ください。
表からも明らかなように、Midjourney V1は最も安価な部類に入り、個人クリエイターや実験的にAI動画を試したいユーザーにとって、極めて魅力的な選択肢となることは間違いない。
「V1」の限界と課題:現時点でできないこと
圧倒的なコストパフォーマンスを誇るV1だが、現時点ではいくつかの明確な限界も存在する。
音声は未対応、編集機能もなし
最大の弱点は、音声生成機能がないことだ。Googleの「Veo 3」やLuma Labsの「Dream Machine」といった競合が動画と同時にサウンドエフェクトやBGMを生成できるのに対し、V1は無音のクリップしか出力しない。そのため、音が必要な場合は別途編集ソフトでの作業が必須となる。
また、複数のクリップを繋ぎ合わせるタイムライン編集や、シーン間のトランジションといった高度な編集機能も搭載されていない。
動画の短さと解像度の課題
動画の長さは最大でも約21秒と短く、長尺のコンテンツ制作には向かない。さらに、実際に出力してみたところ、ダウンロードされる動画の解像度は480p程度であり、高画質が求められる商業利用やプロの現場では力不足となる可能性が高い。
これらの点は、Midjourney自身がV1を「技術的な踏み台」と位置付けていることの表れであり、今後のアップデートでの機能拡充が期待される。
最大のリスク:Disney、Universalが起こした大規模著作権訴訟
V1の輝かしいデビューに、暗く重い影を落としているのが法的な問題だ。リリースのわずか数日前、MidjourneyはDisneyとUniversalというエンターテイメント業界の巨人から、大規模な著作権侵害訴訟を提起された。
「底なしの盗作」と非難される学習データ
訴状は、Midjourneyが「スター・ウォーズ」のダース・ベイダー、「アナと雪の女王」のエルサ、「シンプソンズ」のキャラクターといった、両社が著作権を持つ無数のキャラクターを無断で学習データに使用し、ユーザーがそれらの模倣画像を容易に生成できる状態を放置していると厳しく非難。「底なしの盗作の穴」とまで断じている。
ディズニーの法務顧問は「海賊版は海賊版だ。AI企業によって行われたという事実が、侵害の度合いを軽くするわけではない」と、一切妥協しない姿勢を明確にしている。
動画サービスも「将来の侵害源」として名指し
さらに深刻なのは、この訴状がMidjourneyの動画サービスを「将来の侵害源」としてあらかじめ名指ししている点だ。スタジオ側は、同社がリリース前から動画モデルのトレーニングを開始しており、保護されたキャラクターを動く形で複製する可能性が高いと指摘している。
この訴訟の行方は、AIの学習データに関する「フェアユース」の範囲を定義する上で極めて重要な判例となる可能性があり、Midjourneyの事業そのものを揺るがしかねない。
企業利用における法的リスク
企業ユーザーにとって、この問題は看過できない。Adobeの「Firefly」のように、生成物に対する知財補償を提供するサービスとは異なり、Midjourneyの生成物を利用することには本質的な法的リスクが伴う。この訴訟問題が解決するまで、企業が商業目的でMidjourney V1を利用するには、相当な注意が必要だろう。
期待とリスクが交錯する「約束の地」への船出
Midjourney V1の登場は、AIクリエイティブの世界における画期的な出来事だ。その手軽さ、独特の美的センス、そして何よりも圧倒的なコストパフォーマンスは、AIによる動画制作の裾野を爆発的に広げるポテンシャルを秘めている。
しかし、その船出は決して順風満帆ではない。技術的には音声生成や高解像度化といった課題を残し、競合は猛烈なスピードで進化を続けている。そして何より、ビジネスの根幹を揺るがしかねない大規模な著作権訴訟という巨大な嵐が待ち構えている。
Midjourneyが目指す「リアルタイム世界シミュレーション」という壮大なビジョンは、我々がまだ見ぬデジタルの未来を予感させる、まさに「約束の地」だ。V1はその地を目指すための、小さくも力強い第一歩である。この船が法的な荒波を乗り越え、技術的な進化を遂げ、約束の地にたどり着けるのかは、今後の訴訟の行方が左右することだろう。
Sources
- Midjourney: Introducing Our V1 Video Model