Google、最新音声合成モデル「Gemini 3.1 Flash TTS」を発表:動画編集からゲームまで激変させる声インターフェースの未来とは
Googleは、音声合成技術の停滞を打破する「Gemini 3.1 Flash TTS」を展開し、オーディオタグにより音声の感情表現や抑揚を細かく制御可能にした。この技術は70以上の言語と多様な方言に対応し、高品質なAI音声の民主化とグローバル展開を加速させる。
開発者がGeminiなどの最新AIモデルを迅速にテストし、APIキーを取得してアプリケーションに組み込むためのWebベースの開発ツール。
Googleは、音声合成技術の停滞を打破する「Gemini 3.1 Flash TTS」を展開し、オーディオタグにより音声の感情表現や抑揚を細かく制御可能にした。この技術は70以上の言語と多様な方言に対応し、高品質なAI音声の民主化とグローバル展開を加速させる。
Google DeepMindは、ロボットが自ら「思考」し、複雑なタスクを計画・実行する新時代の到来を告げるAIモデル群「Gemini Robotics 1.5」を発表した。単一の指示をこなすだけでなく、Web検索などの […]
シリコンバレーで最も影響力のあるベンチャーキャピタルの一つ、Andreessen Horowitz (a16z) が2025年8月27日に発表した第5版「トップ100生成AI消費者アプリ」レポートは、生成AI業界において […]
Googleが自社のAIモデル群の頂点に立つ「Gemini 2.5 Deep Think」を、ついに一般向けに解放した。驚異的な問題解決能力を誇るこのモデルは、月額249.99ドル(36,400円)の最上位プラン「AI […]
Googleは、同社のオープンモデルファミリー「Gemma」の最新版として、スマートフォンやタブレット、ラップトップなどのデバイス上で直接動作することを主眼に置いた「Gemma 3n」のプレビュー版を発表した。この新しい […]
Google I/O 2025の開幕を前に、Googleは同社のフラッグシップAIモデル「Gemini 2.5 Pro」の最新アップデート版、「Gemini 2.5 Pro Preview (I/Oエディション)」の早期 […]
Googleは、同社史上最も高性能とされるAIモデル「Gemini 2.5 Pro」のプレビュー版を開発者向けに公開した。これまで制限付きの無料実験版のみだったが、今回のリリースでより高いレート制限と明確な料金体系が導入 […]
Googleは、同社が「最もインテリジェント」と位置づける最新AIモデル「Gemini 2.5 Pro」を発表した。このモデルは、応答前に内部で「思考」する能力を備え、複雑なタスクにおける推論やコーディング性能を大幅に向 […]