Tech Product

Stable Audio 3.0

Overview

Stable Audio 3.0は、Stability AIが開発した音楽および効果音生成AIモデルの最新世代である。最長380秒(6分20秒)の高品質なステレオ音声生成が可能になり、従来のモデルよりも楽曲としての実用性が向上した。4つのモデルで構成され、一部はオープンウェイトとして公開されている。技術的にはSAMEと呼ばれるオートエンコーダーと潜在拡散トランスフォーマーを組み合わせており、可変長生成、インペインティング(部分修正)、継続生成、LoRAによる追加学習など、制作現場での編集を想定した高度な機能を備えている。

Mentioned Articles

2 件