Tech Product

Stable Audio 3.0

Overview

最終更新: 2026年7月13日

Stable Audio 3.0は、Stability AIが開発した音楽および効果音生成AIモデルの最新世代である。最長380秒（6分20秒）の高品質なステレオ音声生成が可能になり、従来のモデルよりも楽曲としての実用性が向上した。4つのモデルで構成され、一部はオープンウェイトとして公開されている。技術的にはSAMEと呼ばれるオートエンコーダーと潜在拡散トランスフォーマーを組み合わせており、可変長生成、インペインティング（部分修正）、継続生成、LoRAによる追加学習など、制作現場での編集を想定した高度な機能を備えている。

Mentioned Articles

2 件

テクノロジー
Stability AI、最長6分20秒の「Stable Audio 3.0」を公開、3モデルはオープンウェイト
Stability AIが公開した音楽・効果音生成モデル「Stable Audio 3.0」は、最長6分20秒のステレオ音声生成に対応し、可変長生成やインペインティングなどの編集機能を統合した。これにより、単発のプロンプト入力から、開発者や制作者が自身の制作フローに組み込める実用的なツールへと進化している。Small、Small SFX、Mediumの3モデルがオープンウェイトで提供され、高速生成とローカルでの反復試行を可能にし、AI音楽生成のワークフローを大きく変革する可能性を秘めている。
2026年5月21日約 10 分
サイエンス
AI導入で時間は節約されるが新たなタスクの必要性がそれを相殺する
生成AI、特にChatGPTのような大規模言語モデル（LLM）の登場は、「仕事の未来を変える」と大きな期待を集めた。しかし、その熱狂から約2年、私たちの働き方は本当に変わったのだろうか？シカゴ大学とコペンハーゲン大学の研 […]
2025年5月3日約 10 分

Stable Audio 3.0

Overview

Mentioned Articles

Stability AI、最長6分20秒の「Stable Audio 3.0」を公開、3モデルはオープンウェイト

AI導入で時間は節約されるが新たなタスクの必要性がそれを相殺する