サイエンス
AIによるクローン音声はオリジナルよりも聞き取りやすい:研究者が驚愕した「不気味なほど滑らかな波形」の正体
最新のAIボイスクローン技術は、背景雑音のある環境下で人間の生声よりも圧倒的に高い明瞭度を持つことが、ユニバーシティ・カレッジ・ロンドンらの研究で実証された。わずか数秒の音声サンプルから個人の声を忠実に再現するこの技術は、騒音環境下で人間の声より13.4%も聞き取りやすく、機械が人間の身体的制約を超えた「より優れた言語伝達手段」を獲得しつつあることを示唆している。
ニューラルネットワークを用いて、人間の声をサンプリングした生の波形を直接学習・生成する技術。従来の合成手法に比べて劇的に自然で滑らかな音声を生成することが可能であり、Googleアシスタントの音声生成エンジンなど、多くの商用音声合成システムの基盤となっている。