テクノロジーと科学の最新の話題を毎日配信中!!

Google Meet、AIリアルタイム翻訳のベータテストを開始: Geminiが実現する「声まで通じる」未来のコミュニケーション

Y Kobayashi

2025年5月21日4:21PM

Google I/O 2025で発表された数々の新技術の中でも、ひときわ大きな注目を集めているのが、ビデオ会議サービス「Google Meet」に搭載されるAIを活用したリアルタイム音声翻訳機能だろう。これは単なる文字起こし翻訳ではなく、話者の声のトーンや抑揚、感情までも再現し、あたかも通訳者が同席しているかのような自然なコミュニケーションを可能にするものだ。

スポンサーリンク

まるでSF? Geminiが実現する「ほぼリアルタイム」かつ「自然な」音声翻訳

Googleは2025年5月20日(現地時間)に開催された開発者向けカンファレンス「Google I/O 2025」において、ビデオ会議ツールGoogle Meetに、リアルタイムで音声を翻訳する新機能を発表した。これは、単に文字起こししたテキストを翻訳するのではなく、話している言葉を直接、相手の言語の音声に変換するという画期的なものだ。

Google Meetには既に、リアルタイムで字幕を生成し、それを他言語に翻訳して表示する機能が提供されている。しかし、今回の「スピーチ・トランスレーション(Speech Translation)」は、その一歩先を行く。Google自身も、「言語の違いは、地域を越えて仕事をする場合であれ、海外の家族とチャットする場合であれ、他の人々とつながる上での根本的な障壁です」と述べており、この機能がその障壁を取り除くことを目指しているのは明らかだ。

声色も感情もそのままに。DeepMind「AudioLM」が可能にする自然な会話

この驚くべきリアルタイム音声翻訳機能の心臓部には、Google DeepMindが開発した大規模言語音声モデル「AudioLM」が採用されている。AudioLMは、膨大な音声データに基づいて訓練・構築されており、「音声から音声へ(audio-to-audio)」の直接変換を可能にする。これにより、翻訳された音声でありながら、元の話者の声色、抑揚、さらには感情までも保持するという、これまでの機械翻訳では考えられなかったレベルの自然さを実現しているのだ。

Use Google Meet speech translation to connect in near real-time across languages

ユーザーが例えばスペイン語で話すと、相手には英語に翻訳された音声が、あたかもその人が元々英語で話しているかのように聞こえる。逆もまた然りで、相手が英語で話した内容は、スペイン語に翻訳されて聞こえてくる。Googleによれば、これは「ほぼリアルタイム、低遅延」で処理され、自由な会話の流れを妨げないことを目指しているという。

ただし、Googleは公式に「翻訳は会話に遅延を引き起こす」とも注記している点には留意が必要だ。具体的には、まず元の言語の音声がかすかに聞こえ、その直後に翻訳された音声がクリアに聞こえるという体験になるようだ。

この機能を利用する際、Google Meetの画面右上には「Speech translation with Gemini」というパネルが表示され、自分が話す言語と聞きたい言語を設定できる。翻訳中は、ビデオフィード全体がGemini(Googleの最新AIモデル群)を象徴する「Geminiグロー」で縁取られ、画面隅には「[言語]から翻訳中」というピルが表示されるため、ユーザーは機能が作動していることを容易に認識できる。

スポンサーリンク

まずは英語・スペイン語から。提供プランと今後の展開

この革新的なリアルタイム音声翻訳機能は、まず消費者向けにベータ版として提供が開始された。利用できるのは、GoogleのAI機能を強化するサブスクリプションプラン「Google AI Pro」(従来のGoogle AI Premium)および、新たに発表された月額249.99ドルの最上位プラン「Google AI Ultra」の加入者だ。現時点ではWeb版のGoogle Meetでのみ利用可能となっている。

特筆すべきは、通話に参加しているメンバーのうち、誰か1人でもこれらのプランに加入していれば、通話参加者全員がこの翻訳機能の恩恵を受けられるという点だ。これは、普及に向けた大きな後押しとなるだろう。

初期に対応する言語は、英語とスペイン語の間の相互翻訳。Googleは今後数週間以内に、イタリア語、ドイツ語、ポルトガル語にも対応を拡大する予定だとしている。

ビジネスシーンでの活用も期待されるが、Google Workspaceの顧客向けには、「今年中に早期テストを開始する」とのことで、本格展開は少し先になる見込みだ。また、Android Authorityによれば、この機能はGoogleの先進的な3Dビデオ会議システム(旧Project Starline)にも将来的には搭載される可能性があるという。

コミュニケーションの未来はどう変わるか?期待される効果

この技術が広く普及すれば、私たちのコミュニケーションのあり方は劇的に変わる可能性がある。

  • 国際ビジネスの加速: 言語の壁による誤解やコミュニケーションの遅延が減少し、より迅速で円滑な国際取引や共同プロジェクトが可能になる。
  • 異文化理解の深化: 言葉のニュアンスが伝わることで、表面的な理解に留まらず、より深いレベルでの異文化理解が進むかもしれない。海外の家族や友人との会話も、これまで以上に心温まるものになるだろう。
  • 教育・研究分野での活用: 世界中の知識や情報へのアクセスが容易になり、国際的な共同研究やオンライン学習の質が向上する。
  • 旅行・観光体験の向上: 現地の人々とのコミュニケーションがよりスムーズになり、旅行体験が一層豊かなものになる。

まさに、Googleが長年掲げてきた「世界中の情報を整理し、世界中の人々がアクセスできて使えるようにする」というミッションを、コミュニケーションの領域で大きく前進させるものと言えるだろう。

スポンサーリンク

残された課題と今後の展望:「バベルの塔」は崩壊するのか?

輝かしい未来が期待される一方で、この技術が真に「翻訳の最終解」となるまでには、いくつかの課題も残されている。

まず挙げられるのが、地域言語やスラングへの対応だ。スペイン語一つとっても、中南米とスペイン本国(さらにはカタルーニャ語など)では大きな違いがある。今回のデモは「準公式な設定で、静かな屋内環境」で行われたものであり、雑音の多い現実世界の多様なシチュエーションで、どこまで精度を保てるのかは未知数である。日本語も、方言によっては同じ日本人でも理解できない事があることは知られており、これは重大な課題となるだろう。

また、Microsoft Teamsも同様のAI翻訳機能をプレビュー提供しており、この分野での競争は今後ますます激化することが予想される。各社がどのように差別化を図り、技術を磨き上げていくのか、目が離せない。

だが、こうした技術には大いに期待したいところだ。完璧な逐語訳を目指すよりも、話者の意図や感情が「伝わる」ことを重視したアプローチは、AI翻訳の新たな地平を切り開くものだと感じる。

もちろん、方言や専門用語、あるいは皮肉やユーモアといった高度な言語表現まで、AIが完全に理解し再現するにはまだ時間がかかるだろう。しかし、今回のGoogle Meetの進化は、言葉の壁によって隔てられていた人々の心をつなぐ、確かな一歩であることは間違いない。

翻訳の「壁」を越え、新たなコミュニケーション時代へ

Google Meetに搭載されるGeminiを活用したリアルタイム音声翻訳機能は、単なる便利なツールを超え、私たちのコミュニケーションのあり方そのものを変革する可能性を秘めている。提供はGoogle AI Pro/Ultraプラン加入者向けのベータ版からと限定的ではあるが、その影響力は計り知れない。

私たちは今、SFの世界で描かれてきたような、言語の制約から解放されたコミュニケーションの入り口に立っているのかもしれない。もちろん、前述の通り課題は残る。しかし、Googleが示したこのビジョンは、間違いなく私たちを興奮させ、今後の進化に大きな期待を抱かせるものだ。

今後、この技術がどのように洗練され、私たちの日常に浸透していくのか。そして、真に「言葉の壁」がない世界が訪れるのか。楽しみに明日を待ちたいところだ。


Sources

Follow Me !

\ この記事が気に入ったら是非フォローを! /

フォローする
スポンサーリンク

コメントする