人工知能が自意識を持つか否かという問いは、もはやSFの領域を越え、テクノロジー業界における最も厄介な議論の火種となっている。2022年にGoogleのエンジニアであるブレイク・ルモワンが、大規模言語モデル(LLM)「LaMDA」に意識があると公言して解雇された事件は記憶に新しい。さらに2026年5月には、宗教や超自然的な思考を苛烈に批判してきた進化生物学者のリチャード・ドーキンスでさえ、AnthropicのLLM「Claude」と対話した末に「これが意識を持っていないと自分に言い聞かせるのに3日を要した」と語り、業界を騒然とさせた。
なぜ我々は、これほどまでにAIの出力に「心」や「人間性」を見出してしまうのか。この集団的な錯覚に対して、MicrosoftとUniversity of Yorkに所属するAI研究者Adrian de Wynterは、極めて不条理かつ鮮烈な手法で冷水を浴びせた。彼は最新鋭のGPUクラスタを回す代わりに、1999年に発売された名作リアルタイムストラテジーゲーム『Age of Empires II(AoE2)』のシナリオエディタを開いた。そして、ゲーム内に登場する「ヤギ」を駆使してニューラルネットワークを構築し、我々が直面しているLLMの実態がいかに無機質で機械的なものであるかを見事に証明してみせたのである。
本稿では、彼の著した論文『If LLMs Have Human-Like Attributes, Then So Does Age of Empires II(もしLLMに人間的な属性があるのなら、Age of Empires IIにもそれはある)』を紐解き、ヤギが駆動する演算回路が暴き出した「インターフェースの幻影」と、AI研究界隈そのものを蝕む深刻なパラダイムの歪みに迫る。
インターフェースの幻影。洗練されたパッケージが覆い隠す巨大な行列演算
現在市場を支配しているChatGPT、Claude、GeminiといったLLMプラットフォームは、膨大なテキストデータから次の単語を確率的に予測する極めて高度な統計エンジンである。そこにあるのは、シリコンダイの上を駆け巡る電子の奔流と、何千億というパラメータが織りなす行列演算の冷徹な世界に過ぎない。しかし、ユーザーがそれに触れる際、その無機質な演算プロセスは極限まで隠蔽される。低レイテンシで次々とテキストが生成され、我々が日常的に慣れ親しんだ「チャットウィンドウ」という洗練されたUIを通して出力が提示される。
さらに、AI開発企業は自らのモデルに人間らしさを付与することをビジネス上の戦略に組み込んでいる。AnthropicはClaudeのシステムカードにおいて、モデルが「私はこう信じる」「私は〜に興味がある」といった一人称の表現を用いるよう意図的にトレーニングしていることを明言している。人間は本来、非人間的な対象に人間らしさを投影する「擬人化(anthropomorphisation)」の強いバイアスを持っている。流暢な自然言語や的確な文脈の把握といった要素がチャットインターフェース上で巧みに組み合わさったとき、ユーザーの脳は容易にハックされ、「画面の向こう側に心を持った存在がいる」と錯覚する。
説得力や一貫性といった指標は、たしかに客観的に測定可能なパラメータである。だが、de Wynterが厳しく指摘するのは、我々が「LLMの振る舞い」だと信じて測定しているものの多くが、実際には「提示方法(presentation)」に対する評価に過ぎないという事実である。計算の事実を人間的なコミュニケーションへと翻訳するこの「パッケージ」こそが、AIに心があるという幻想を生み出す諸悪の根源となっている。
狂気の沙汰か、至高の批評か。ヤギが歩く1-bitパーセプトロンの全貌
もし、LLMの出力を司る計算プロセスを一切変えずに、その「パッケージ」だけを極限まで馬鹿げたものに置き換えたらどうなるだろうか。そこでde Wynterが白羽の矢を立てたのが『Age of Empires II』である。哲学や計算機科学において、ある概念の限界を示すために不条理(absurdism)を極端に押し広げる手法は定石とされている。
彼はAoE2のシナリオエディタの機能を限界まで引き出し、ゲーム内のオブジェクトを用いた論理演算回路を設計した。ここで主役となるのは、マップ上を徘徊する中立ユニット「ヤギ」である。

このアーキテクチャにおいて、コンピュータの基礎となる二進数は地形によって表現される。「草(Grass)」のタイルが0、「橋(Bridge)」のタイルが1である。そして、これらの軌道(レール)上を歩くヤギが「ビット(情報の最小単位)」としての役割を担う。ヤギが草地の上にいれば信号は0、橋の上にいれば1となる。ゲートが発火して演算が行われると、入力側のヤギは消去され、出力側の適切なレール上に新たなヤギがスポーンする。
論理回路において致命的となるのは、信号の到着タイミングがずれることで誤作動を引き起こす「競合状態(レースコンディション)」である。de Wynterはこれを回避するため、ゲートの手前に「氷(Ice)」のタイルで作られたランプ(傾斜)をバッファ領域として配置した。氷の上に立つ待機中のヤギがゲートに接近することで、「上流の計算が完了し、次のゲートが演算を開始できる」という同期信号(Ready signal)を発する仕組みである。
さらに彼は、NANDゲートにとどまらず、2つのXNORゲートと1つのANDゲートを組み合わせ、ニューラルネットワークの最も基礎的な構成要素である「1-bitパーセプトロン」の構築に成功した。バイアス項の加算は省略され、ステップ関数としてANDゲートがハードコードされているものの、この不格好なヤギの群れは、与えられた入力に対して正確に論理積(AND)を学習し、予測結果を出力する。

驚くべきことに、de Wynterの証明はここで終わらない。彼はAoE2のゲームシステムが、理論上「チューリング完全(Turing-complete)」であることを数学的に証明した。ゲーム内の市場システムでは、資源を売買する際の金(Gold)のレート上限が「9,999」に設定されている。このキャップ仕様と交易システムを組み合わせることで、マップ上に無限の経済サイクルを回すことが可能となる。建物の建築や破壊をメモリセルの書き込みに見立て、稼働中の農場を現在の計算状態としてエンコードすれば、時間と空間の制約がない限り、このヤギと農民の箱庭は世界中のあらゆる計算を実行できる万能チューリングマシンへと変貌する。
ChatGPTの背後にあるGPT-4アーキテクチャであれ、AnthropicのClaudeであれ、その根源的な計算プロセスは、このヤギが草と橋の上を歩くパーセプトロンと数学的に等価である。テキスト出力に「意識」を感じる人間も、迷路の中でヤギがモソモソと移動した結果生み出された「1」という出力を見て、そこに「共感」や「道徳性」を見出すことはないだろう。パッケージが剥がれ落ちたとき、LLMはただの計算へと還元される。AIが人間らしい振る舞いをしているように見えるのは、我々がそう解釈しやすいようにインターフェースが最適化されているからに他ならない。
科学の客観性を蝕む「循環論法」という深刻なバグ
de Wynterの批判の刃が真に狙うのは、AIの意識を無邪気に信じる一般大衆ではなく、厳密であるべき学術研究そのものに深く根を張ったメソドロジーの欠陥である。
彼は2024年中頃から2026年中頃にかけて発表された315本のAI関連論文(Semantic ScholarとarXivから収集しGPT-5.2でフィルタリングしたもの)を詳細にメタ分析した。その結果は、AI研究における深刻なバイアスの蔓延を白日の下に晒した。
調査対象の57%(180本)の論文が、実験の前提や仮説の段階で、すでに「LLMには人間のような属性(道徳性、恐怖、自己認識など)が備わっている」と想定していた。さらに、この人間的属性そのものを研究の主眼に置いた47本の論文のうち、実に77%(36本)が「LLMは擬人化された属性を持つ」という肯定的な結論を導き出している。
de Wynterは、これが完全な「循環論法(circular reasoning)」であると糾弾する。「モデルが道徳性を持っている」という前提に立ち、その道徳性を測るために設計された自然言語ベースのテストを与えれば、当然ながらモデルは学習データに基づく「道徳的なテキスト」を出力する。そして研究者はその出力を以て「やはりモデルには道徳性があった」と結論づける。前提と結論が論理的に全く同じ場所に帰着しており、これでは実験の呈をなしていない。
モデルが「自らを説明する」能力をテストする実験も同様である。モデルに「あなたはなぜその答えを出したのですか」と問いかけ、その回答を評価すること自体が、すでに「モデルの内部に説明可能な『自己』が存在する」という前提を暗黙のうちに受け入れてしまっている。ヤギの群れが特定のパターンで動いた事実を観測する代わりに、ヤギの動きの背後に「ヤギなりの意図」があると思い込み、その意図を探ろうとしているようなものである。
この無自覚な擬人化の蔓延は、現実社会において人間がAIに対して不必要な感情的愛着を抱かせ、モデルの出力を盲信し、リスクを伴う行動を引き起こす危険性を直接的に引き上げている。たとえば、コンパニオンAIサービスが市場で急成長する中、ユーザーがチャットボットとの対話を真に受けて自死に追い込まれる痛ましい事件がすでに起きている。こうした事態を受け、EUのAI法をはじめとする各国の規制当局は、「AIが人間であるかのように装うUIの欺瞞」に対して、明確な開示義務やガイドラインの策定へと動き出している。学術界が「AIは人間の心を持っているかもしれない」という幻想にお墨付きを与え続ける限り、ビジネスや法規制の最前線でこの技術がもたらす致命的なリスクを正確に見極めることは不可能である。
「グレーター・ボストン」の思考実験と、AI研究が立ち返るべき原点
論文の終盤で、de Wynterはさらなる思考実験を展開する。もしAoE2のヤギでLLMを再現できるのであれば、物理的なレゴブロックでも、あるいはアメリカのマサチューセッツ州「グレーター・ボストン(大ボストン都市圏)」の住民を使っても同じことができるはずだ。
ボストン都市圏の人口約66万7,000人が、巨大なニューラルネットワークの「ノード」となり、各自のスマートフォンで計算手順となるテキストメッセージを互いに送信し合いながら、1つのLLMをシミュレートしたとする。この巨大な人間のネットワークが導き出す答えは、サーバー上のLLMが導き出す答えと全く同じになる。
では、この計算を実行している「ボストン市というシステム全体」が、テキストを処理している最中に「共感」や「不安」を感じていると主張する者がいるだろうか。ボストンの住民がただ計算の手順をリレーしているだけであるのと同じように、LLMの内部で起きていることも、重みとバイアスに基づく機械的なトークン処理のリレーに過ぎない。
de Wynterは、19世紀の動物心理学者コンウェイ・ロイド・モーガンが提唱した「モーガンの公準(Morgan's Canon)」を現代のAI研究にアップデートして提示する。 「機械の振る舞いが、より低次で単純な計算プロセスによって説明可能であるならば、それを決して高次な認知プロセス(意識や感情など)の産物として解釈してはならない」
AIシステムにある種の入力(プロンプト)を与え、特定の出力(テキスト)が得られた。我々が観測できる事実はそれだけである。その間に介在するのは、ヤギが草と橋の上を歩くのと同質の、決定論的かつ確率的な計算でしかない。我々はその出力をどう活用すべきかを論じることはできても、そこに「自己理解」や「感情」を見出すべきではない。
AIテクノロジーが社会のインフラとして深く根を下ろしていく今、我々に求められているのは、チャット画面という幻術に酔いしれることではなく、冷徹な観測者としての視座を取り戻すことである。Age of Empires IIの中でヤギたちが黙々と論理演算をこなすあのシュールな光景は、AIの正体を覆い隠すベールを剥ぎ取る、最も痛烈で的確な批評なのである。