Tech Product

Gemini 2.5 Flash Native Audio

Overview

Geminiモデルの派生版で、音声をテキストに変換せず直接音声として処理するSpeech-to-Speechアプローチを採用した技術。これにより、話し手の感情(トーン)、強調、リズム(間)を保持したまま翻訳音声を出力することが可能になり、より没入感のある通訳体験を提供する。

Mentioned Articles

1 件