Tech Product

AudioLM

Overview

Google DeepMindが開発した、高品質な音声生成を可能にする大規模言語音声モデル。テキストの介在なしに音声から音声への直接的な変換や生成を学習し、話者の声のトーン、抑揚、感情といった特徴を極めて自然に再現できる。Google Meetのリアルタイム翻訳機能の核となる技術であり、従来の機械的な合成音声とは一線を画す自然な会話体験を実現する。

Mentioned Articles

1 件

External Mentions

10 件