自然界が数億年かけて到達し得た、しかし実際には選択しなかった進化の道筋を、人工知能が解き明かした。Meta(旧Facebook)出身の研究者らが設立したEvolutionaryScaleは、生命の進化を模倣する新しい人工知能モデル「ESM3」を用いて、これまでに存在しなかった蛍光タンパク質の設計に成功した。この画期的な成果は科学誌「Science」に掲載され、生命進化の新たな可能性を示すものとして世界的な注目を集めている。
自然界を超えた設計思考
EvolutionaryScaleが開発したESM3は、従来の人工知能とは根本的に異なるアプローチを採用している。このモデルの革新性は、タンパク質の「配列」「構造」「機能」という3つの要素を統合的に理解し、操作できる点にある。研究チームは生物学史上最大規模となる1.07×10²⁴回の演算を実施し、31.5億のタンパク質配列から生成された7,710億のデータポイントを用いて学習を行った。
ESM3の特筆すべき特徴は、その学習方法にある。このモデルは単にタンパク質の配列を予測するだけでなく、タンパク質が進化の過程で獲得してきた深い構造を理解しようと試みる。アマゾン熱帯雨林から深海、熱水噴出孔、土壌中の微生物まで、地球上の多様な環境から収集された膨大なタンパク質データを基に、進化が選択し得る可能性のある全ての道筋を探索するのだ。
研究チームはこのモデルを用いて、新しい緑色蛍光タンパク質(GFP)の設計に挑戦した。GFPは、クラゲやサンゴの発光の原因となるタンパク質で、現代のバイオテクノロジーにおける重要なツールとなっている。しかし、GFPファミリーの特徴的な性質である「自身の構造から発光性のクロモフォアを自発的に形成する」という機能は、自然界でも極めて稀少な特性だ。
このような大規模な変異を持ちながら機能を維持できる理由は、ESM3が進化の本質的なメカニズムを理解していることにある。モデルは単にタンパク質の配列を予測するのではなく、進化が取り得る全ての可能性を探索し、機能を維持したまま新しい構造に到達する道筋を見出すのだ。これは、生命が数十億年かけて探索してきた進化の過程を、人工知能が効率的にシミュレートできることを示している。
進化の新しい地図を描く
この研究の特筆すべき点は、単に新しいタンパク質を作り出しただけでなく、自然界が選択しなかった進化の道筋を発見したことにある。EvolutionaryScaleの共同創設者でチーフサイエンティストのAlexander Rives氏は、「ESM3は、私たちが建築物や機械、マイクロチップを設計するように、生物学を第一原理から設計できる未来への一歩です」と述べている。
研究チームは、蛍光タンパク質の設計において「思考の連鎖(Chain of Thoughts: CoT)」と呼ばれるアプローチを採用した。まず、クロモフォア(発光に必要な部分)の形成と触媒反応に不可欠な残基の配列と構造を特定し、これをAIモデルに与えた。その後、ESM3は与えられた条件を満たしながら、全く新しいタンパク質の設計を試みた。
最初の実験で、研究チームは88種類の設計を試み、その中から「B8」と名付けられた興味深い候補を発見した。B8は既知の蛍光タンパク質と57%の類似性しか持たない新規の構造を示したものの、その輝度は既存のGFPの50分の1程度だった。しかし、研究チームはこのB8を出発点として設計を改良し、最終的により明るい「esmGFP」の創出に成功した。
esmGFPの特筆すべき点は、既存の蛍光タンパク質とは96カ所もの遺伝的変異を持ちながら、なお効率的に機能することだ。このタンパク質は、中心にある湾曲したアルファヘリックスを11本のベータバレル(樽状の構造)が取り囲むという、GFPファミリーに特徴的な構造を維持している。しかし、その詳細な構造は既知のものとは大きく異なり、特にタンパク質の内部に22カ所もの変異が存在する。これは、クロモフォアの近接性と相互作用の高密度により、通常は変異に対して極めて敏感だとされる領域での大規模な変化を意味する。
興味深いことに、esmGFPは天然のGFPと同等の輝度を示し、その励起スペクトルのピークは496nm、発光スペクトルのピークは512nmに現れた。この特性は、既存のGFPと似た機能を持ちながら、全く異なる構造によってそれを実現していることを示している。タンパク質が同じ機能を実現するために、自然界が選択した以外の道筋が存在することを、この研究は具体的に示したのだ。
さらに注目すべきは、このタンパク質が示す進化的な距離である。研究チームは、サンゴやイソギンチャクなどの生物が持つ蛍光タンパク質との比較を行い、esmGFPが示す配列の違いは、異なる目(綱の下の分類)に属する生物種間で見られる程度の差異に相当することを明らかにした。これは、ESM3が自然進化と同等の複雑さを持つ進化経路を発見できることを示している。
進化は必然か、それとも偶然か
この研究は、進化生物学における最も根源的な問いの一つに、具体的な示唆を与えている。1989年に古生物学者のStephen Jay Gouldが著書『Wonderful Life』で提起した「生命の歴史のテープを巻き戻して再生したら、同じ結果になるのか」という問いは、30年以上にわたって生物学者たちを魅了してきた。Gouldは、もし進化を100万回やり直したとしても、ホモ・サピエンスのような生物が再び現れる可能性は極めて低いと主張した。
この問いに対して、科学者たちは長年「決定論」と「偶然性」という二つの立場で議論を重ねてきた。決定論的な見方は、環境による選択圧が強く働くため、進化は予測可能な方向に進むという立場だ。一方、偶然性を重視する立場は、SF作家Ray Bradburyの短編『サウンド・オブ・サンダー』で描かれたように、過去の微細な変化が将来に大きな影響を及ぼすと考える。
ESM3による今回の研究は、この議論に新たな視点をもたらすものだ。ミシガン州立大学のZachary Blount教授は、この発見の意義を「地球上では進化しなかった(と我々が考える)生物学的な可能性が実際に存在することを示しており、進化が取り得たが取らなかった本物の道筋を示唆している」と評価する。同時にBlount教授は、ESM3が生成したタンパク質が既存のGFPと42%の類似性を保持していることから、自然界にも一定の決定論的な要素が存在することを指摘している。
生物学の未来を切り開くAI
「ESM3は、構造物や機械、マイクロチップを作るのと同じように、AIが第一原理から構築するためのツールとなる生物学の未来への一歩です」と、Rives氏は言う。彼は、生物学はこれまで創造された中で最も高度なテクノロジーであり、共通のアルファベットである遺伝暗号を使ってプログラム可能であると考えている。その前提に立って開発されたESM3は「生物学的データをすべて理解し、翻訳し、生成ツールとして使えるように流暢に話す」のだ。
タンパク質設計の新しい方法論を確立したこの研究は、医薬品開発やプラスチック分解能力を持つ合成タンパク質の設計など、幅広い応用可能性を秘めている。同時に、生命進化の本質に関する私たちの理解を深める重要な一歩となっているのだ。
ただしベース大学の進化生物学者Tiffany Taylor氏は、このような技術革新の可能性を認めつつも、「自然選択によって何百万年もかけて磨かれてきた複雑なプロセスを上回れると考えるのは、過度に自信過剰かもしれない」と慎重な見方も示している。
論文
参考文献
- EvolutionaryScale: ESM3: Simulating 500 million years of evolution with a language model
- El Pais: AI simulates 500 million years of evolution to discover artificial fluorescent protein
- Live Science: New glowing molecule, invented by AI, would have taken 500 million years to evolve in nature, scientists say
コメント