2003年のヒトゲノム計画完了は、人類が自らの生命の設計図を初めて手にした歴史的瞬間だった。しかし、その31億文字にも及ぶDNA配列の大部分は、長らく沈黙を守り続けてきた。タンパク質の設計図となる遺伝子(コーディング領域)はゲノム全体のわずか2%。残りの98%は「ジャンクDNA」とさえ呼ばれ、その機能は謎に包まれていた。Google DeepMindが発表した新たなAIモデル「AlphaGenome」は、この広大な“ゲノムの暗黒物質(ダークマター)”に光を当て、生命科学における最も根源的な問いの一つに答えようとする野心的な試みだ。
生命科学の「最後のフロンティア」―ゲノムの98%に潜む謎
我々の細胞内にあるゲノムは、生命活動のすべてを司る壮大な命令書だ。しかし、その命令書のほとんどのページは、これまで解読不能な言語で書かれているかのようだった。この「非コード領域」と呼ばれるゲノムの98%は、かつては機能を持たない“がらくた”だと考えられていた。
しかし近年の研究で、この領域が遺伝子の活動を絶妙にコントロールする「スイッチ」や「ボリューム調整ノブ」のような役割を果たしていることが明らかになってきた。いつ、どこで、どの遺伝子を活性化させるか。その精緻な制御こそが、細胞が多様な機能を発揮し、複雑な生命体が形作られる上で不可欠なのだ。
そして、この領域に潜むわずかな変異が、がんや心疾患、自己免疫疾患といった多くの病気の引き金になることも分かってきた。問題は、どの変異が、どのように遺伝子のスイッチを狂わせるのかを特定するのが、絶望的に困難だったことだ。30億文字の中からたった一つの文字が変わるだけで、生命の運命が左右されることがある。この複雑怪奇な因果関係を解き明かすことは、現代生物学における「最後のフロンティア」とも言える挑戦だった。
AlphaGenome登場―「オールインワン」でゲノムを解読するAI
この巨大な壁に挑むため、Google DeepMindが開発したのが「AlphaGenome」だ。タンパク質の立体構造予測AI「AlphaFold」で世界に衝撃を与えた同社が、次なるターゲットとしてゲノム機能の解読に乗り出した。
AlphaGenomeは、特定の機能予測に特化した従来のAIとは一線を画す。「オールインワン」のアプローチを採る、統一的なDNA配列モデルである。その能力は驚異的だ。
- 広大な視野と精密な視点: 一度に最大100万塩基対という、遺伝子とその広範な調節領域を丸ごとカバーする長大なDNA配列を読み込む。同時に、たった一つの塩基(DNA文字)の違いがもたらす影響を予測できる「塩基単位の解像度」を両立させている。
- マルチモーダル予測: 遺伝子発現、RNAが切り貼りされるプロセス(スプライシング)、ゲノムの立体構造、タンパク質がDNAに結合する位置など、多岐にわたる数千の生物学的プロセスへの影響を、一度の計算で同時に予測する。
これは、100万文字の長編小説を読解し、登場人物の複雑な相関関係や物語の伏線、さらには一つの誤植が結末に与える影響までを瞬時に解き明かすようなものだ。
なぜ「100万塩基対」と「塩基単位の解像度」が重要なのか?
この「広大な視野」と「精密な視点」の両立こそが、AlphaGenomeのブレークスルーの核心だ。遺伝子の働きは、すぐ隣にあるスイッチだけでなく、時には数十万塩基対も離れた場所にある「遠隔操作スイッチ(エンハンサー)」によっても制御される。AlphaGenomeの100万塩基対という広大な入力範囲は、こうした遠隔の相互作用を捉えるために不可欠だった。
一方で、疾患の原因となるのは、たった一つの塩基が置き換わる変異(SNV)であることが多い。塩基単位の高い解像度がなければ、その微細な変化がもたらす致命的な結果を見逃してしまう。従来のモデルは、この「範囲」と「解像度」のどちらかを犠牲にするしかなかった。AlphaGenomeは、技術的な革新によってこのトレードオフを克服したのである。
TransformerとCNNの融合―AlphaGenomeの心臓部
この偉業を可能にしたのは、畳み込みニューラルネットワーク(CNN)と、近年のAIの進化を牽引するTransformerアーキテクチャを巧みに融合させた設計だ。公式プレプリントによれば、U-Netと呼ばれる画像解析で実績のあるアーキテクチャに着想を得ており、以下のように機能する。
- エンコーダ(CNN): 入力されたDNA配列から、局所的なパターン(短いモチーフなど)を効率的に抽出する。
- トランスフォーマー: 配列全体の長距離にわたる依存関係(遠隔のエンハンサーと遺伝子の関係など)を捉える。
- デコーダ(CNN): 抽出された情報を統合し、塩基単位での高解像度な予測結果を生成する。
この計算処理は、GoogleのTPU(Tensor Processing Unit)上で並列実行され、100万塩基対という長大な配列の解析をわずか4時間という驚異的な速さで完了させる。
既存モデルを凌駕する驚異的な性能

AlphaGenomeは、その設計思想の正しさを圧倒的な性能で証明した。DeepMindが実施した広範なベンチマークテストにおいて、既存の最先端モデル(多くは特定タスクの専門モデル)と比較された。
- 単一DNA配列の機能予測: 24項目の評価のうち、22項目で既存の最高性能モデルを上回った。
- 遺伝的変異の調節効果予測: 26項目の評価のうち、24項目で既存の最高性能モデルを上回るか、同等の性能を達成した。
特筆すべきは、AlphaGenomeが「汎用モデル」でありながら、個別のタスクに特化して開発された「専門モデル」としのぎを削り、多くの場合で凌駕している点だ。これは、AlphaGenomeが単に多くのタスクをこなすだけでなく、DNAにコードされた遺伝子制御の根本的な原理を深く学習していることを示唆している。
がん遺伝子のスイッチを“予言”―T-ALLでの実証例
その実力は、具体的な疾患の解析でも示されている。研究チームは、T細胞性急性リンパ芽球性白血病(T-ALL)患者で見つかった非コード領域の変異をAlphaGenomeで解析した。
その結果、この変異が「MYB」というタンパク質の新たな結合部位を作り出し、それによって近傍にあるがん遺伝子「TAL1」のスイッチを異常にONにしてしまう、という既知の疾患メカニズムを正確に再現してみせた。これは、AlphaGenomeが非コード領域の変異と特定の疾患関連遺伝子を機能的に結びつける強力なツールとなり得ることを示す好例だ。
ユニバーシティ・カレッジ・ロンドンのMarc Mansour教授は、「非コード領域の変異の重要性を判断するのは、特に大規模に行う場合、非常に困難です。このツールはパズルの重要なピースを提供し、がんのような病気を理解するためのより良い繋がりを作ることを可能にするでしょう」と期待を寄せる。
科学界からの期待と評価―研究の現場はどう変わるか?
AlphaGenomeの登場は、科学界から大きな期待をもって迎えられている。スタンフォード大学の計算ゲノミクス研究者、Anshul Kundaje氏はNature誌に対し、「エキサイティングな飛躍だ。現在の最先端モデルのほぼ全てにおいて真の改善が見られる」とコメント。
研究現場でのインパクトは計り知れない。これまで、一つの遺伝子変異の影響を調べるためには、複数の実験や異なる計算モデルを駆使する必要があり、膨大な時間と労力がかかっていた。AlphaGenomeは、多様な分子メカニズムへの影響を一度に、かつ数秒でスコアリングできる。
メモリアル・スローン・ケタリングがんセンターのCaleb Lareau氏はScience誌の取材に、「何百ものことをテストする代わりに、正しい場所に導かれていくつかのことに集中できるようになる。これは非常に重要だ」と語る。研究者は、無数の仮説の中から最も有望なものだけを効率的に選び出し、実験的検証に進むことができる。研究開発のサイクルが劇的に高速化する可能性があるのだ。
応用範囲は、がんや希少疾患の研究にとどまらない。特定の細胞だけで遺伝子を活性化させるようなDNA配列を設計する「合成生物学」や、創薬ターゲットの探索など、幅広い分野での活用が見込まれている。
残された課題と未来への展望―「仮想細胞」への道
輝かしい成果の一方で、DeepMindはAlphaGenomeの限界についても率直に認めている。
- 超遠隔の相互作用: 10万塩基対を超えるような、非常に遠くに位置する調節要素の影響を正確に捉えることは依然として困難である。
- 細胞・組織特異性: 細胞や組織ごとの微妙なパターンの違いをより高い精度で再現するには、さらなる改善が必要。
- 個人ゲノム予測への非対応: このモデルは、個人のゲノム情報から疾患リスクや体質を直接予測するようには設計・検証されていない。
これらは、今後の研究開発における重要な課題となる。プレプリントでは、DNA言語モデルの活用や、DNAメチル化など新たなデータモダリティの統合といった、将来の方向性も示唆されている。
Google DeepMindのCEO、Demis Hassabis氏がかつて語った「仮想細胞をシミュレートする」という壮大な夢。AlphaGenomeは、その夢の実現に向けた大きな一歩と言えるだろう。生命の設計図の全貌を理解し、その動作原理をシミュレートできるようになった時、医学と生物学は新たな次元へと突入するに違いない。
現在、AlphaGenomeは非商用目的の研究者向けにAPI経由でプレビュー版が提供されている。ゲノムの98%という広大な未知の領域に、世界中の研究者がAIという新たな灯りを手に挑み始める。生命の最も深い謎が解き明かされる日は、そう遠くないのかもしれない。
論文
参考文献
- Google DeepMind: AlphaGenome: AI for better understanding the genome
- GitHub: google-deepmind/alphagenome
- Science: DeepMind’s latest AI tool makes sense of changes in the human genome
- Nature: DeepMind’s new AlphaGenome AI tackles the ‘dark matter’ in our DNA
- STAT News: DeepMind launches AlphaGenome, aiming to predict gene regulation from DNA sequence