テクノロジー
Google、最新音声合成モデル「Gemini 3.1 Flash TTS」を発表:動画編集からゲームまで激変させる声インターフェースの未来とは
Googleは、音声合成技術の停滞を打破する「Gemini 3.1 Flash TTS」を展開し、オーディオタグにより音声の感情表現や抑揚を細かく制御可能にした。この技術は70以上の言語と多様な方言に対応し、高品質なAI音声の民主化とグローバル展開を加速させる。
別名: Audio Tags
Gemini 3.1 Flash TTSで導入された技術。自然言語のコマンドをテキストに挿入することで、話すペース、トーン、アクセント、感情(熱狂的、驚きなど)を開発者がプログラマブルに指定できる。