Google DeepMindと、AI医療スピンオフ企業であるIsomorphic Labsは、タンパク質予測AIモデルの最新版「AlphaFold 3」を発表した。この新たなAIモデルは、科学者が新しい治療法を発見する方法に革命をもたらす可能性がある。
生体分子の動きを予測する
細胞内で行われる活動のほとんどは、私たちが生きて呼吸し、思考する動物を維持するための活動であり、タンパク質によって処理されている。タンパク質は細胞同士のコミュニケーションを可能にし、細胞の基本的な代謝を行い、DNAに保存された情報をさらに多くのタンパク質に変換する手助けをする。そしてそのすべては、タンパク質のアミノ酸の連なりが、機能するための複雑かつ特異的な立体形状に折り畳まれるかどうかにかかっている。
これまで、この3次元形状を理解するためには、タンパク質を精製し、電子顕微鏡やX線結晶構造解析のような精巧な手法でしかタンパク質の構造を研究できなかった。これは時間と労力のかかるプロセスであった。しかし、GoogleのAI部門のひとつであるDeepMindが2021年にAlphaFoldをリリースした事でこの状況は一変した。このソフトウェアは完璧ではなく、すべてのタンパク質について信頼性の高い解を提供するわけではなかったが、これまで困難だったタンパク質がどのように折り畳まれるかを衝撃的な精度で予測出来た。タンパク質の形状と構造を知ることで、それが人体とどのように相互作用するかが分かり、科学者は新薬を作ったり、既存のものを改良したりすることができる。
新バージョンのAlphaFold 3は、DNAを含むあらゆる生物学的分子の構造と相互作用をかつてない精度で予測できるという。これは、2020年にタンパク質構造予測における画期的なブレークスルーを広く認知させた前身であるAlphaFold 2を大きく上回る進歩だ。
「AlphaFold 3は、タンパク質を超えて、広範な生体分子へと私たちを導きます。この飛躍は、生物再生可能な材料やより弾力性のある作物の開発から、薬剤設計やゲノム研究の加速まで、より変革的な科学を解き放つ可能性があります」と、Google DeepMindの研究チームはブログ投稿で書いている。
AlphaFold 2がタンパク質の構造予測しかできなかったのに対し、AlphaFold 3はタンパク質、DNA、RNA、リガンド、イオン、化学修飾の相互作用をモデル化するレベルにまで進化している。タンパク質とリガンドの相互作用を予測する場合、AlphaFold 3は従来の方法よりも50%精度が高いとGoogle DeepMindは述べている。
このモデルの中核は、AlphaFold 2のベースとなったEvoformerモジュールの改良版だとGoogle DeepMindは説明している。また、分子予測に、DALL-EやStable DiffusionなどのAI画像ジェネレーターに用いられているような、新しい拡散モデルを用いた事が大きな進歩だという。つまり、プロセスは原子の位置がランダムでノイズの多い「雲」から始まり、徐々にノイズを減らし、原子の真の配置を再構築するものとなる。このプロセスは繰り返し行われ、最終的な予測を行うまで、モデルはステップごとに分子構造をより明確に把握していく。
ただし、拡散モデルは、幻覚を起こしやすい傾向があるため、大きな懸念材料であった。つまり構造が存在しないにもかかわらず、それを作り上げてしまう可能性があるのだ。幻覚を抑えるため、DeepMindチームは、通常、タンパク質の構造化されていない断片を非常に識別しやすい構成にするソフトウェアの以前のバージョンから得られた構造予測でモジュールを訓練した。その結果、ほとんどの幻覚は信頼度の低い予測としてラベル付けされ、少なくとも特定できるようになった。
Google DeepMindによると、新薬の開発で特に有望なポイントは、AlphaFold 3が実験的な構造データに頼ることなく、タンパク質と薬物や抗体との相互作用を予測できることだという。
つまりAlphaFold 3は、出発点としてタンパク質の正確な3次元構造を必要とする物理モデルを必要としないのだ。これまでの手法では、X線結晶構造解析や核磁気共鳴(NMR)分光法などの実験的手法で、時間とコストのかかる構造を決定しなければならない。X線結晶構造解析のためにタンパク質の結晶を成長させるには数週間から数ヶ月かかり、NMR実験には高価な装置としばしば大規模な最適化が必要なのだ。
DeepMindはAlphaFold 3の機能のほとんどを、非商用研究のために新しく立ち上げたAlphaFold Serverを通じて無料で利用できるようにしている。数回クリックするだけで、科学者は機械学習の経験や利用可能なコンピューティングリソースに関係なく、AlphaFold 3を使用することができる。
DeepMindチームは、AlphaFold 3が “生物学的世界の理解と創薬を一変させ “可能性を秘めていると考えている。このシステムは、“生物学的世界を高精細”にし、“科学者が細胞システムを、構造、相互作用、修飾に渡って、その複雑さのすべてにおいて見ることを可能”にする。
その目的は、人生を変える治療法の開発を加速させることである。しかし、その利点はまだ実際に示されなければならない。Isomorphic Labsは、社内プロジェクトと製薬会社の両方で、AlphaFold 3を実際の創薬デザインの課題にすでに使用している。
論文
参考文献
- Google: AlphaFold 3 predicts the structure and interactions of all of life’s molecules
- Isomorphic Labs: Rational drug design with AlphaFold 3
- AlphaFold Server
研究の要旨
AlphaFold2の登場は、タンパク質の構造とその相互作用のモデリングに革命を起こし、タンパク質のモデリングとデザインにおける膨大な応用を可能にした。本論文では、タンパク質、核酸、低分子、イオン、修飾残基を含む複合体の共同構造予測が可能な、拡散ベースのアーキテクチャを大幅に更新したAlphaFold 3モデルについて述べる。新しいAlphaFoldモデルは、従来の多くの特殊化されたツールよりも大幅に精度が向上している。タンパク質-リガンド相互作用に関しては、最新のドッキングツールよりもはるかに高い精度を示し、タンパク質-核酸相互作用に関しては、核酸特異的予測ツールよりもはるかに高い精度を示し、抗体-抗原予測精度はAlphaFold-Multimer v2.3よりも大幅に高くなっている。これらの結果を合わせると、単一の統一されたディープラーニングのフレームワークで、生体分子空間全体にわたる高精度のモデリングが可能であることを示している。
コメント