Stability AIが、先日リリースした最新モデル「Stable Diffusion 3 “Medium”(SD3 Medium)」の初期リリースが期待に沿わなかったことを認め、数週間以内に大幅な改善版をリリースすることを発表した。
目次
Stable Diffusion 3のユーザーコミュニティから品質に問題ありとの指摘
Stability AIによると、SD3 Mediumは社内テストの段階では、「プロンプト遵守性」「生成画像の多様性」「詳細さ」「全体的な画質」において、前モデルのSDXLを上回る性能を示していたという。
しかし、一般公開後、ユーザーコミュニティから重大な品質問題が指摘された。特に顕著だったのは以下の2点である:
- 人物のポーズに関する問題:Redditなどのプラットフォームでユーザーから指摘があった特徴的な問題として、草の上に横たわる人物の画像生成に苦心するケースが挙げられた。
- 稀少単語の処理:トレーニングデータセットに稀にしか現れない単語の扱いに課題があることが明らかになった。
これらの問題に対処するため、Stability AIは以下の2つの重点分野に焦点を当てている:
- 継続的なモデル改善:
- SD3 Mediumを開発途上のプロジェクトと位置づけ、数週間以内に大幅に改良されたバージョンのリリースを目指す。具体的な改善点として、人物のポーズの多様性向上や、稀少単語の処理能力の強化が期待される。
- モデルの最適な使用法の研究:
- 新しいアーキテクチャとモデルの最適な使用方法について、継続的な研究を進めている。
- モデルの効果的な使用方法やファインチューニング技術に関する知見が得られ次第、コミュニティの発見も含めて積極的に共有する予定である。
ライセンス条件の改訂
品質面での改善に加え、Stability AIはライセンス条件に関する懸念にも対応している:
- 個人クリエイターや小規模ビジネス向けのライセンスを改訂。
- 年間売上高100万ドル未満の個人や企業は、商用利用も含めて無料でStability AIのモデルを使用可能となった。
- 非商用目的での使用(研究者による科学雑誌での結果発表を含む)は、個人や組織を問わず無料で許可されている。
- 商用利用に関しては、年間売上高が100万ドルを超える企業のみがエンタープライズライセンスを必要とする。
Stability AIは、これらの改善策を通じてオープンソースコミュニティへの支援を継続する姿勢を示している。同社は、高品質な生成AIモデルとテクノロジーの提供に努めながら、コミュニティからのフィードバックを重視し、透明性のある開発プロセスを維持することを約束している。
Source
- Stability AI: License Update
コメント