OpenAIのGPT-4oやGoogleのGemini、AnthropicのClaudeなど、現代を代表するAIモデルのほぼ全てはニューラルネットワークに基づいて構築されている。だがこのニューラルネットワークは、1960年代に考案された生体ニューロンの計算モデルに基づくものであり、こうした年代物とも言える古い技術に基づいていることが現代のAIの更なる発展を妨げている可能性があるとして、Flatiron Instituteの研究者らは根本的に新たなニューロンモデルを開発し、これを置き換える事を提案している。
ニューロンはこれまで考えられていたよりも多くの能力を持っている可能性
Flatiron Instituteの一部門であるCenter for Computational Neuroscience(CCN)は、モデルの開発により科学的実験のデザインを改善し、人間の脳を理解するための新しい枠組みを構築することを支援している。
CCNの研究者らは、個々の神経細胞の仕組みを解明し、1960年代に開発された現在のニューロンモデルを分析した結果、このモデルがニューロンの振る舞いを完全には表現していないことを理解した。彼らの新たな研究によれば、個々のニューロンは従来考えられていたよりも周囲に対してより大きな制御力を持っていると考えられるという。
論文の上級著者であるDmitri Chklovskii氏はプレスリリースで次のように述べている。「神経科学はこの60年間でかなり進歩し、以前のニューロンモデルがかなり基本的なものであることが現在認識されています。ニューロンは、この過度に単純化されたモデルよりもはるかに複雑な装置であり、はるかに賢いのです」。
論文の中で著者らは、以前のモデルが「実際のニューロンが持つ計算能力を完全に捉えていない」可能性があり、AIの発展を妨げている可能性があると示唆している。
「AIの成果は非常に印象的ですが、まだ多くの問題があります。現在のアプリケーションは間違った答えを出したり、幻覚を見たりすることがあり、トレーニングには多くのエネルギーが必要で、非常にコストがかかります。人間の脳が避けているように見えるこれらの問題がすべてあります。脳が実際にどのようにこれを行っているかを理解できれば、より良いAIを構築できるでしょう」と、Chklovskii氏は述べている。
人工ニューラルネットワークは、人間の脳が情報を処理し決定を下す方法を模倣することを目的としているが、これは、現実よりもはるかに単純化された方法で行っている。これらのネットワークは、1960年代のニューロンモデルに基づく「ノード」の順序付けられた層で構築されている。ネットワークは情報を受け取る入力層のノードから始まり、情報を処理する中間層のノードを経て、結果を送信する出力層のノードで終わる。
通常、ノードは前の層のノードから受け取る総入力が特定の閾値を超えた場合にのみ、次の層に情報を渡す。現在の人工ニューラルネットワークがトレーニングされる際、情報はノードを一方向にのみ通過し、ノードが連鎖の早い段階のノードから受け取る情報に影響を与える方法はない。
だが、研究者らによれば、「我々の脳細胞は単なる受動的な入力のリレーではなく、実際に仲間のニューロンの状態を制御するために働いている可能性がある」と言うのだ。
新たに発表された「ニューロン・アズ・コントローラーモデル」は、ニューロンを小さな「コントローラー」として扱っている。コントローラーとは、周りの状況を見て、それに合わせて影響を与えることができる装置のことだ。つまり、我々の脳細胞は単なる受動的な入力のリレーを行うだけではなく、実際に仲間のニューロンの状態を制御することも行っている可能性があるというのだ。
ニューロン・アズ・コントローラーモデルは、多くのニューロンで構成される脳の大規模回路について科学者が理解していることから着想を得ている。ほとんどの脳回路は、処理チェーンの後半にある細胞が、チェーンの早い段階で起こることに影響を与えるフィードバックループに組織されていると考えられている。家や建物の温度を維持する温度調節器と同様に、脳回路は身体のシステムが活動で圧倒されるのを避けるために、自身を安定した状態に保つ必要がある。
Chklovskii氏は、「人々は脳全体や脳の一部をコントローラーとして考えていました。しかし、誰も単一のニューロンがそれを行うことができると提案しませんでした。制御は計算集約型のタスクです。ニューロンに十分な計算能力があるとは考えにくいのです」と、述べている。
だが、ニューロンをミニコントローラーとして見ることで、これまで説明されていなかったいくつかの生物学的現象も説明できるとChklovskii氏は述べている。例えば、ニューロンが信号を発火しても、別のニューロンがそれを受け取らないことがあるため、神経科学者たちは人間の脳におけるランダム性の存在に疑問を持っていた。しかし、ニューロンをミニコントローラーとする新しい理解により、このノイズの一部がパフォーマンス向上剤として機能することが確認されたという。
つまり、新しく改良されたモデルに少しのノイズを加えることで、ニューロンが常に変化する環境に柔軟に対応できるようになったのだ。研究者たちは、「このランダム性は、実際のニューロンの機能を複製する上で重要である」ことを発見したと報告している。
言い換えれば、ニューロンは入力を制御できるのだが、すべてのニューロンがこの能力を示すわけではないようで、これは今後の研究の方向性となっている。この新しいモデルの対象である脳深部のニューロンのように、これらのニューロンは入力に影響を与えることはできなくても、同様に入力を予測することができるかもしれない。
「制御と予測は実際に非常に関連しています。世界における自分の行動の影響を予測せずに効率的に制御することはできません」と、Chklovskii氏は述べている。
ニューロンが計算を行う洗練度は、今まで完全には理解されていなかった。「ニューロンは従来考えられていたよりも周囲に対してより大きな制御力を持っている」のである。
したがって、更新されたモデルは、人間の脳の最も複雑なメカニズムを活用する、より優れた、そして実質的により効果的な人工ニューラルネットワークを推進する可能性がある。
論文
- Proceedings of the National Academy of Sciences: The neuron as a direct data-driven controller
参考文献
- Simons Foundation: New Computational Model of Real Neurons Could Lead to Better AI
研究の要旨
生理学的データが乏しい中で神経細胞機能をモデル化するためには、神経細胞生理を計算目的の最適化として解釈する規範理論を開発することが有望な戦略である。本研究では、主に予測を最適化する現在の規範モデルを、ニューロンを最適なフィードバック制御器として概念化することによって拡張する。私たちは、ニューロン、特に初期感覚野以降のニューロンは、その出力を通して、環境を特定の望ましい状態に導くと仮定する。この環境は、シナプスで相互リンクされたニューロンと外部運動感覚フィードバックループの両方から構成され、ニューロンがシナプスフィードバックによって制御の有効性を評価することを可能にする。ループダイナミクスを暗黙的に識別し、潜在的な状態を推測し、制御を最適化する生物学的に実現可能なコントローラとしてニューロンをモデル化するために、我々は現代の直接データ駆動制御(DD-DC)フレームワークを利用する。我々のDD-DCニューロンモデルは、スパイクタイミングに依存する可塑性における増強から抑制へのシフトとその非対称性、フィードフォワードとフィードバックニューロンフィルターの持続時間と適応性、一定の刺激下でのスパイク生成の不正確さ、脳の特徴的な動作変動とノイズなど、様々な神経生理学的現象を説明する。われわれのモデルは、従来のフィードフォワード、インスタント応答のMcCulloch-Pitts-Rosenblattニューロンから大きく逸脱しており、神経回路網を構築するための、生物学的情報に基づいた最新の基本単位を提供する。
コメント