ショウジョウバエ、マウス、ゼブラフィッシュ、酵母、そして小さな線虫C. elegansは、現代生物学を支えてきたモデル生物である。

科学者たちがこれらを選んだのは、その魅力ゆえではない。多くの種にまたがる生物学的原理を照らし出す共通点を持つからこそ選ばれた。その生物学は研究者が習得できる程度にシンプルでありながら、何世紀にもわたって新たな知見をもたらし続けるほどの深みを持つ。

しかし、生物学者には、この分野の広大な領域——細胞の働き手であるタンパク質——に関する共通の基準点がない。タンパク質は化学反応を触媒し、細胞に構造を与え、細胞同士のコミュニケーションを助ける。ほとんどの生物は数万種類ものタンパク質を使用しており、それぞれが変異・修飾・測定され得るうえ、無数の環境下でさまざまな手法によって研究される。さらに、人工知能の貢献もあり、研究者が研究しきれないほどのペースで新しいタンパク質が生み出されている。

共通の基準点がなければ、研究結果の比較は困難である。2つの研究室が同じタンパク質を異なる実験条件下で研究すれば、結果が一致しないこともある。その結果、科学文献には、断片的な知見が散在し、重複も多く、一般化が困難な状況が生まれている。

計算化学者として蛍光タンパク質を研究する筆者は、研究室にはモデルタンパク質の集合も必要だと主張する。ショウジョウバエやマウスが各分野の基盤となっているように、モデルタンパク質は研究者が互いの成果を積み上げ、生物学の基礎をより深く理解するための助けとなるはずだ。

緑色蛍光タンパク質は研究対象を可視化する。Moen et al/BMC Cancer, CC BY-SA

AD

モデルとしての緑色蛍光タンパク質

モデルタンパク質が基準となるならば、出発点として最適なのは、研究者が信頼できる標準として既に手を伸ばしているタンパク質である。緑色蛍光タンパク質(GFP)は、そのリストの筆頭に挙げられる。

クラゲから最初に単離された緑色蛍光タンパク質は、青色光を当てると鮮やかな緑色に発光する。生物学者はGFPを他のタンパク質と融合させ、そのタンパク質がどこへ移動し、いつ生成されるかを追跡する。

GFPはすでに事実上の基準点として機能しており、より大きな目標に挑む前の予備実験において練習用タンパク質として使われている。2000年代初頭、研究者たちはGFPとその黄色変異体をクローン豚に使用し、外来遺伝子を大型哺乳類に導入して確実に機能させられることを示した。豚の細胞が蛍光遺伝子にコードされたタンパク質を産生していることを文字通り目で確認できたため、GFPは新しい遺伝子が正常に組み込まれたことを明白に示した。

緑色蛍光タンパク質は、ノーベル賞を受賞した発見である。

これらの実験の長期的な目標は、免疫系が豚の臓器を拒絶せずに受け入れるよう助ける特定のヒトタンパク質を産生する豚を作ることであった。GFPはこのアイデアの基本的な工学的実現可能性を示し、それが最終的に初の豚からヒトへの腎臓移植へとつながった。

GFPの使用は多くの研究の終着点ではなく、実証のステップである。新しい遺伝子が存在し、細胞がそのタンパク質を産生しており、タンパク質が機能していて、おそらく他のタンパク質とも機能するであろうことを研究者が確認するための手段なのだ。

AIがベンチマークを必要としている

研究者が酵素・治療薬・材料として使える新しいタンパク質を探す際、タンパク質言語モデルや他の生成AIの手法は、試験すべき膨大な数の候補タンパク質配列を提案できる。AI設計のタンパク質の一部は実験室で機能し、試行錯誤を減らせるものの、多くの候補タンパク質は失敗に終わる。

蛍光タンパク質はタンパク質言語モデルの負荷試験として有用である。AIによるタンパク質生成において最も難しい部分は、提案された配列が正しく折り畳まれた機能するタンパク質になり得ることを証明することだ。

GFPはその証明を簡単にする。蛍光によってタンパク質が正しく折り畳まれているかどうかをすぐに確認できるからだ。蛍光タンパク質の明るさ・安定性・色を予測し、AIが生成したタンパク質がそれに合致するかを直接検証できる。薬がヒトに効くかもしれないと示唆するマウス実験のように、GFPはAIモデルがあらゆるタンパク質で成功することを保証するわけではないが、設計パイプラインが正しく機能していることを示す迅速で広く信頼された指標となる。

蛍光タンパク質は実験を視覚化する。Erik A. Rodriguez/Wikimedia Commons, CC BY-SA

GFPをモデルタンパク質と位置づけることは、生物学の教育にも改善をもたらすだろう。古典的なモデル生物と同様、GFPは安全で視覚的である。また、寛容性も高く、学生の実験デザインが完璧でなくても明確な蛍光シグナルを示す。

こうした特性により、GFPは遺伝子発現・タンパク質折り畳み・バイオエンジニアリングといった概念への教育的な入口となる。抽象的な概念を、試験管の中や顕微鏡下で目で見えるものに変えることができるのだ。

モデル生物が機能するのは、科学コミュニティが共通の基準点を中心に構築することに合意したからである。タンパク質科学は今や十分に広大になり、同様の枠組みを必要としていると筆者は考える。GFPをモデルタンパク質として指定することで、発見の連携、学生の教育、新しいツールの評価が容易になるはずだ。

言い換えれば、その輝きは今もなお科学者を導き続けることができる——単に目を奪うだけでなく、分野全体の知識を積み上げる助けとなることで。


本記事は、コネチカット大学 化学教授 Marc Zimmer氏によって執筆され、The Conversationに掲載された記事「1 protein to rule them all – why crowning the protein that makes jellyfish glow green as a model can help scientists streamline biology」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。