テクノロジーと科学の最新の話題を毎日配信中!!

Google DeepMind、創薬支援AI「TxGemma」公開 高精度予測で開発加速へ

Y Kobayashi

2025年3月26日

Google DeepMindは、創薬プロセスの効率化を目指すオープンAIモデル群「TxGemma」を発表した。Gemmaモデルを基盤とし、有望なターゲット特定から臨床試験結果予測まで、治療薬開発の全段階を支援することで、開発期間の短縮とコスト削減に貢献することが期待される。

スポンサーリンク

創薬の課題解決を目指すTxGemma

新薬開発は、成功確率が低く、莫大な時間と費用を要する極めて困難なプロセスである。米国立医学図書館(National Library of Medicine)が発行した2022年の研究によると、実に90%もの候補薬が第1相臨床試験を通過できないという厳しい現実がある。この課題に対し、Google DeepMindは大規模言語モデル(LLM: Large Language Models)の能力を活用すべく、TxGemmaを開発・公開した。

TxGemmaは、昨年10月に発表された創薬関連タスク向け言語モデル「Tx-LLM」の後継にあたる。Tx-LLMに対する研究者コミュニティからの強い関心と、独自データでの利用や微調整(ファインチューニング)への要望に応える形で、実用的なスケールを持つオープンモデルとして開発された。

高度な予測能力を持つ「Predict」モデル

TxGemmaは、Googleの軽量・高性能なオープンモデルファミリー「Gemma 2」をベースに、700万件の治療薬関連データを用いてファインチューニングされている。予測タスクと対話型の治療薬データ分析に特化した設計で、パラメータ数が20億(2B)、90億(9B)、270億(27B)の3サイズが用意されている。

各サイズには「Predict」バージョンが含まれる。これは、Therapeutic Data Commonsから抽出された特定のタスクに特化しており、以下のような予測を行う。

  • 分類 (Classification): 分子が血液脳関門を通過できるか、といった二値的な判断。
  • 回帰 (Regression): 薬物の結合親和性の予測など、連続値の推定。
  • 生成 (Generation): ある化学反応の生成物から、反応物のセットを生成するなど。

特に最大サイズの「TxGemma 27B Predict」モデルは、非常に高い性能を示す。Google DeepMindによると、このモデルは66個の評価タスクのうち64個において、先行モデルであるTx-LLMと同等以上の性能を示し、そのうち45個ではTx-LLMを上回った。さらに、特定の単一タスクに特化して設計された多くの既存モデルと比較しても、66個中50個のタスクで同等以上の性能を達成し、うち26個ではそれらを凌駕した。詳細なベンチマーク結果は、公開されている論文で確認できる。

スポンサーリンク

対話型AI「Chat」モデルによる深い洞察

TxGemmaには、9Bと27Bのパラメータを持つ「Chat」バージョンも用意されている。これらのモデルは、一般的な指示応答データを用いた追加学習により、予測の根拠を説明したり、複雑な質問に答えたり、複数ターンにわたる対話を行ったりする能力を持つ。

例えば、研究者はTxGemma-Chatに対し、「なぜこの分子が毒性を持つと予測したのか?」と問いかけ、分子構造に基づいた説明を得ることができる。TRUSTBYTES社の共同創設者兼CEOであるJeremy Prasetyo氏は、「自身の予測を説明できるAIは、創薬にとって画期的なものだ。より迅速な洞察は、患者ケアにおけるより迅速なブレークスルーを意味する」と、AIによる説明能力の重要性を指摘している。ただし、この対話能力を獲得した代償として、Predictバージョンと比較すると、純粋な予測タスクにおける性能はわずかに低下する。

ファインチューニングとAgentic-Txによる拡張性

TxGemmaはオープンモデルであるため、研究者自身が独自のデータを用いて特定のタスクに合わせてモデルを調整(ファインチューニング)できる点が大きな特徴である。Google DeepMindは、臨床試験における有害事象を予測するためにTxGemmaをファインチューニングする方法を示すColabノートブックの例(TrialBenchデータセットを使用)を公開している。これにより、研究者は自身の専有データを活用し、特定の研究ニーズに合わせた、より精度の高い予測モデルを構築できる可能性がある。

さらに、Google DeepMindは、TxGemmaをより複雑な研究課題に取り組むためのエージェントシステムに統合するデモンストレーションとして「Agentic-Tx」を紹介している。これは、最新の外部知識や複数ステップの推論を必要とするタスクに対応するために開発された、治療薬開発に焦点を当てたシステムであり、Gemini 2.0 Proを搭載している。Agentic-Txは、以下の18のツールを備えている。

  • 複数ステップ推論のためのツールとしてのTxGemma
  • PubMed、Wikipedia、ウェブからの一般検索ツール
  • 特定の分子ツール
  • 遺伝子およびタンパク質ツール

Agentic-Txは、Humanity’s Last ExamやChemBenchといった推論能力を重視する化学・生物学系のベンチマークにおいて、最先端の結果を達成している。複雑なワークフローを編成し、複数ステップの研究質問に答えるためにAgentic-Txを使用する方法を示すColabノートブックも公開されている。

TxGemmaモデル群は、Vertex AI Model GardenおよびHugging Faceを通じて本日より利用可能となっている。Google DeepMindは、コミュニティがTxGemmaを活用し、さらに改良していくことで、治療薬開発が加速されることを期待している。


Sources

Follow Me !

\ この記事が気に入ったら是非フォローを! /

フォローする
スポンサーリンク

コメントする