2016年のSF映画『メッセージ』(原題:Arrival)では、言語学者が、円形の記号で書かれた回文(前から読んでも後ろから読んでも同じ意味になるフレーズ)で構成された異星人の言語を解読するという困難な課題に直面する。彼女が様々な手がかりを発見する中、世界各国がそれぞれ異なる解釈をし、中には脅威だと捉える国もあった。
もし人類が今日このような状況に直面したとすれば、最善の策は人工知能(AI)が言語を発達させる過程を解明する研究に目を向けることかもしれない。
しかし、そもそも言語とは何によって定義されるのだろうか。私たちのほとんどが周囲の人々とコミュニケーションを取るために少なくとも1つの言語を使用しているが、それはどのように生まれたのだろうか。言語学者たちは数十年にわたってこの問いについて考察を重ねてきたが、言語の進化を解明する簡単な方法は存在しない。
言語は一過性のものであり、化石記録には痕跡を残さない。骨とは異なり、古代の言語を発掘して時間の経過とともにどのように発展したかを研究することはできない。
人類の言語の真の進化を研究することはできないかもしれないが、シミュレーションによって何らかの洞察が得られる可能性がある。ここでAIが登場する。筆者が過去3年間研究してきた創発的コミュニケーションという興味深い研究分野である。
言語の進化をシミュレートするため、エージェント(AI)にコミュニケーションを必要とする単純なタスクを与える。例えば、あるロボットが地図を見せることなく、別のロボットをグリッド上の特定の場所に案内するようなゲームである。何を言うか、どのように言うかについてほとんど制限を設けず、単にタスクを与えて好きなように解決させる。
これらのタスクの解決にはエージェント同士のコミュニケーションが必要であるため、時間の経過とともにそのコミュニケーションがどのように進化するかを研究することで、言語の進化についての手がかりを得ることができる。
人間を対象にした同様の実験も行われている。英語話者である自分が、英語を話さない相手とペアを組むことを想像してみよう。テーブル上に並べられた様々な物の中から、緑色の立方体を拾うよう相手に指示するのが課題である。
手でキューブの形を表現するジェスチャーをしたり、緑色を示すために窓の外の草を指さしたりするかもしれない。時間の経過とともに、一種の原始言語が発達するだろう。「キューブ」や「緑」を表す特定のジェスチャーや記号を作り出すかもしれない。繰り返しの相互作用を通じて、これらの即興的な信号はより洗練され一貫性を持つようになり、基本的なコミュニケーションシステムを形成する。
AIの場合も同様である。試行錯誤を通じて、目にした物体についてコミュニケーションを取ることを学び、会話の相手はそれを理解することを学ぶ。
しかし、彼らが何について話しているかをどのように知ることができるのだろうか。人工的な会話相手との間でのみ言語を発達させ、私たちとの間では発達させない場合、各単語が何を意味するかをどのように知ることができるのだろうか。結局のところ、特定の単語が「緑」を意味するのか、「キューブ」を意味するのか、あるいはさらに悪いことに両方を意味するのかもしれない。この解釈の課題が、筆者の研究の重要な部分となっている。
コードを解読する
AI言語を理解する課題は、一見ほとんど不可能に思えるかもしれない。もし筆者が英語しか話さない共同研究者にポーランド語(筆者の母語)で話しかけたとしても、お互いを理解することはできず、各単語がどこで始まりどこで終わるのかさえ分からないだろう。
AI言語との課題はさらに大きい。なぜなら、人間の言語パターンとは全く異なる方法で情報を整理している可能性があるからである。
幸いなことに、言語学者たちは情報理論を用いて未知の言語を解釈する高度なツールを開発してきた。
考古学者が断片から古代の言語を組み立てるように、AIの会話におけるパターンを使用して、その言語構造を理解する。時には人間の言語との驚くべき類似点を見出し、また時には全く新しいコミュニケーション方法を発見する。
これらのツールは、AIコミュニケーションの「ブラックボックス」を覗き込み、人工的なエージェントがどのように独自の情報共有方法を発達させるかを明らかにする助けとなる。
筆者の最近の研究は、エージェントが見ているものと発言を使用して、その言語を解釈することに焦点を当てている。未知の言語での会話の記録と、各話者が見ていたものの記録があると想像してみよう。記録内のパターンと参加者の視野内の物体を照合することで、単語と物体の間の統計的な関連性を構築することができる。
例えば、「yayo」というフレーズが鳥が飛び過ぎる場面と一致する場合、「yayo」は話者の「鳥」を表す言葉であると推測できる。これらのパターンを慎重に分析することで、コミュニケーションの背後にある意味を解読し始めることができる。
筆者と同僚による最新の論文(Neural Information Processing Systems (NeurIPS)の会議録に掲載予定)では、このような手法を用いてAIの言語と構文の少なくとも一部を逆解析できることを示し、彼らがどのようにコミュニケーションを構築している可能性があるかについての洞察を得ている。
異星人と自律システム
これは異星人とどのように関連するのだろうか。AIの言語を理解するために開発している手法は、将来的な異星人とのコミュニケーションの解読に役立つ可能性がある。
もし異星人のテキストと、そのテキストに関連する何らかの文脈(視覚情報など)を入手できれば、同じ統計的ツールを適用して分析することができる。今日開発している手法は、異星言語学(xenolinguistics)と呼ばれる異星人の言語研究において、将来的に有用なツールとなる可能性がある。
しかし、この研究から恩恵を受けるために異星人を見つける必要はない。ChatGPTやClaudeのような言語モデルの改善から、自動運転車やドローン間のコミュニケーションの改善まで、数多くの応用が考えられる。
創発的な言語を解読することで、将来の技術をより理解しやすいものにすることができる。自動運転車がどのように動きを調整するのか、AIシステムがどのように意思決定を行うのかを知ることは、単に知的システムを作り出すだけでなく、それらを理解することにもつながるのである。
コメント