ChatGPTが自然言語処理の分野で革命を起こしたように、生物学の分野でもAI(人工知能)による革命的な進歩が起きている。元Metaの研究者らが設立したEvolutionaryScaleが開発した新しいAIモデル「ESM3」は、自然界に存在しないタンパク質を一から設計できる能力を備えているというのだ。このモデルは、AmazonのAWSプラットフォームを通じて研究者に提供され、創薬から環境問題の解決まで、幅広い分野での応用が期待されている。
ESM3:生物学のためのAI言語モデル
ESM3は、タンパク質の配列、構造、機能を同時に理解し、生成できる大規模言語モデルである。このモデルは27億8000万のタンパク質データを学習し、7710億の固有の情報を処理している。この膨大なデータ量により、ESM3は自然界に存在しない全く新しいタンパク質を設計することが可能になった。
具体的な成果として、研究チームはESM3を使用して新しい蛍光タンパク質を作成した。この人工タンパク質は、自然界の蛍光タンパク質と比較して配列の一致率が58%しかない。研究者らによれば、これと同程度の進化が自然界で起こるには5億年以上かかると推定されるとのことだ。
EvolutionaryScaleの共同創設者であり主任科学者のAlexander Rives氏は次のように述べている:「ESM3は、AIを使って構造物や機械、マイクロチップを設計し、コンピュータープログラムを書くのと同じように、生物学を一から設計できる未来への一歩を踏み出しました。私たちはこの技術を長い間開発してきましたが、今回科学コミュニティと共有し、彼らがどのように活用するかを見るのが楽しみです」。
ESM3の潜在的な応用範囲は広く、新しいがん治療法の開発から、二酸化炭素を捕捉するタンパク質の設計まで及ぶ。AmazonはAWSを通じてこの技術を提供することで、世界中の何十万人もの研究者や、トップ10の製薬会社のうち9社がこのモデルを利用できるようにしている。
AWSの生成AIおよび健康サービスを利用することで、研究者たちは自社の独自データを使ってESM3モデルを安全にカスタマイズし、スケールアップすることが可能になる。さらに、AmazonはEvolutionaryScaleとの提携を通じて、Amazon SageMaker、AWS HealthOmics、Amazon Bedrockなどのサービスを通じてESM3を提供し、創薬から合成生物学までの応用を加速させることを目指している。
このような生物学向けの基盤モデル(bFM)の民主化は、一般的な大規模言語モデル(LLM)や基盤モデル(FM)と同様に、慎重に進められている。AWSは包括的なポートフォリオを通じて、ESM3のような生物学向けの基盤モデルへの安全なアクセスを提供する。これにより、研究者は独自のデータセットを使ってモデルを微調整し、革新的な発見を促進しながら、機密データを保護することができる。
ESM3の登場は、生物学的応用に特化した生成AIモデルの新時代の始まりを告げるものである。AWSの生成AI機能とEvolutionaryScaleの革新的なAIモデルの相乗効果により、創薬のタイムラインを大幅に短縮する可能性を秘めている。この協力関係は、生命科学企業が責任ある生成AIの力を活用して、ターゲットの特定を効率化し、イノベーションを促進し、開発時間とコストを削減し、最終的には新しい治療法をより速く患者に届けることを可能にするだろう。
Sources
コメント