テクノロジー
Google、最新音声合成モデル「Gemini 3.1 Flash TTS」を発表:動画編集からゲームまで激変させる声インターフェースの未来とは
Googleは、音声合成技術の停滞を打破する「Gemini 3.1 Flash TTS」を展開し、オーディオタグにより音声の感情表現や抑揚を細かく制御可能にした。この技術は70以上の言語と多様な方言に対応し、高品質なAI音声の民主化とグローバル展開を加速させる。
AI音声合成の分野で先行するElevenLabs社の最新モデル。Gemini 3.1 Flash TTSの比較対象として挙げられ、高品質な音声生成能力を持つが、Googleの新モデルはこれを超えるスコアを記録したとされる。