Adobeは、Adobe MAX London 2024において、同社が取り組む生成AIモデルFireflyの大型アップデートとなる「Adobe Firefly Image 3 Foundation」モデルのリリースを発表した。
新たなFirefly Image 3 Foundation 3モデルでは、カスタムスタイルとのマッチング、画像内のテキストのレンダリング向上、より高品質な画像の生成など、DALL-EやMidjourney、Stable Diffusionなど他社のAIモデルに比べて劣っていたその機能に大幅な改善が見られ、より使いやすく改善されている。Firefly Image 3モデルは、併せて発表されたアップデートされたPhotoshop(ベータ版)とFireflyのWeb版で本日から利用可能だ。
Adobe Firefly Image 3 Foundation
Adobeによると、Firefly Image 3 Foundationモデルは、よりクリエイティブなコントロール、新しい自動スタイライズ機能、構成とスタイルの参照機能、写真品質とプロンプト理解度の向上、イラストやアイコンのための幅広いスタイルが特徴とのことだ。
- 自動スタイライズ機能による新次元のクリエイティブな表現: 新しいスタイルエンジンを搭載した Adobe Firefly Image 3 Foundation モデル(ベータ版)の自動スタイライズ機能では、より高品質でバラエティに富んだ出力が可能となり、生成する画像のスタイルをより自由にコントロールできます。画像出力には、さまざまなスタイル、色、背景、被写体のポーズなどが含まれ、クリエイティブなアイデアを生み出すための幅広いオプションが用意されています。
- 「構成参照」と「スタイル参照」によるクリエイティブコントロールの強化: Adobe Firefly Image 3 Foundation モデル(ベータ版)の「構成参照」と「スタイル参照」機能により、卓越したユーザーコントロールと最先端のビジュアル品質が実現します。構成参照により、参照用画像の構成にマッチした新しい画像をすばやく生成できるため、完璧なプロンプトの作成のための試行錯誤が不要になります。また、スタイル参照では、より高品質な出力が実行されるため、ユーザーは生成されるスタイルをより自由にコントロールし、パーソナライズすることができます。これらの機能を組み合わせることで、ユーザーは画像の構成とスタイルの両方を参照し、素早くアイデアを形にすることができます。
- 高品質な画像:Adobe Firefly Image 3 Foundation モデル(ベータ版)は、より高性能な照明、ポジショニング、バラエティによって、高品質な画像を提供します。人物のレンダリング(細かな特徴、さまざまなムードや表情)、複雑な構造、集合体も大きく改善しています。
- 豊富なディテールとプロンプトの精度:Adobe Firefly Image 3 Foundation モデル(ベータ版)は、テキストプロンプトとシーンをより深く理解しているため、長くて複雑なプロンプトを正確に反映し、より多くのディテールを含んだ画像生成が可能です。テキストレンダリングも改善され、明確なテキストディスプレイの画像生成が可能になりました。これにより、ポスターのようなアセットのアイデア出しがより効率的になります。
- イラストとアイコンの幅広いスタイル:Adobe Firefly Image 3 Foundation モデル(ベータ版)は、出力におけるイラストを大きく改善し、アイコンやロゴ、ラスター画像、線画をすばやく作成できます。
加えてAdobeによると、このモデルは生成速度も大幅に向上しており、アイデア発想とデザインプロセスの生産性と効率を高めるという。
また、ボタンひとつで背景や画像コンテンツのバリエーションを作成することもできる。このアップデートには、シャープネスと鮮明度を自動的に調整する「ディテールを強調」や、プリセットとブラシによる非破壊調整などの機能も含まれている。
Photoshop(ベータ版)の新たな機能
Photoshopにはこれまで、生成塗りつぶしや生成拡張機能があったが、テキストプロンプトからゼロから画像を生成することはできなかった。最新のPhotoshop(ベータ版)には、AIによってテキストから画像を生成できる新しい画像生成機能が搭載されている。
この機能が生成塗りつぶしと異なるのは、画像がゼロから作成されることだ。生成塗りつぶしのように既存の画像に手を加えたり、生成拡張で既存の画像を拡大したりするわけではない。
この機能は、新しいAdobe Firefly Image 3 Foundationモデルによって提供される。
Adobe Fireflyと、Midjourney、SDXL、Ideogram、DALL-E 3との大きな違いは、学習データの出所にある。Adobeは、自社のストックデータベースからライセンスされた素材のみを使用してモデルを学習させるため、法的に問題のない画像を作成できると主張する数少ないベンダーの1つである。
しかし最近、Adobe StockにはMidjourneyが作成した画像も含まれていることが明らかになった。Firefly 3でもそうなるかは不明だ。プレスリリースの中でAdobeは、Adobeのポリシーに違反するコンテンツをブロックし削除する、多段階の継続的なレビューとモデレーションプロセスについて言及している。
コメント