Tech Product

Gemini 2.5 Flash Native Audio

Overview

最終更新: 2026年7月18日

Geminiモデルの派生版で、音声をテキストに変換せず直接音声として処理するSpeech-to-Speechアプローチを採用した技術。これにより、話し手の感情（トーン）、強調、リズム（間）を保持したまま翻訳音声を出力することが可能になり、より没入感のある通訳体験を提供する。

Mentioned Articles

1 件

テクノロジー
Google翻訳が「全ヘッドホン対応」リアルタイム翻訳のベータ版を開始
言葉の壁が、また一つ音を立てて崩れ去ろうとしている。 Googleは2025年12月13日、同社の翻訳サービス「Google翻訳」に対し、生成AIモデル「Gemini」を統合する大規模なアップデートを発表した。このアップ […]
2025年12月13日約 9 分