2024年ノーベル化学賞(2)
受賞理由
タンパク質構造予測プログラムの開発
受賞者
イギリス
アメリカ合衆国
解説
タンパク質はまるで長いひもが複雑に丸まった立体パズルです。その形を知ることは、鍵と鍵穴の関係のように働きを理解する手がかりになります。ハサビスさんとジャンパーさんは、人工知能(AI)を使って、このパズルを瞬時に解くしくみを作りました。AIはたくさんのタンパク質の形を学び、新しいタンパク質でも形を当てられるようになったのです。今では科学者が新しい薬や治療法を考えるとき、すぐに形を確かめられる便利な道具になりました。
関連キーワード
AlphaFold
DeepMind が開発したタンパク質構造予測 AI。初代は2018年CASP13で飛躍的に精度を高め、2020年のAlphaFold2 で実験級の分解能を実現。モデルはトランスフォーマーを核としたエンドツーエンド学習で、入力配列から直接座標を出力する。コードと推定構造データベースはオープンアクセスで公開され、世界中の研究者が利用。生命科学におけるAI応用の転換点と評価される。
トランスフォーマー
自然言語処理で開発されたニューラルネットワーク構造で、自己注意機構により長距離依存関係を効率的に学習する。タンパク質配列は一次元文字列として扱えるため、配列中の共進化パターン抽出に適用可能。AlphaFold2 やProteinBERTなど多くのバイオAIモデルで採用。並列計算に向いておりGPU/TPU上で大規模学習が容易。構造予測だけでなく配列生成や機能予測にも応用が拡大している。
多重配列アラインメント
進化的に関連するタンパク質配列を並べ、保存残基や共変異パターンを可視化する手法。構造予測では相互情報量が接触推定の強力な手がかりとなる。AlphaFold2 はMSAを直接ネットワーク入力とし、自己注意で共通特徴を抽出。深いMSAが得られにくい孤立配列では精度が低下するため、環境メタゲノムを活用して被覆率を向上させる試みが進む。配列データベース拡張が予測性能向上に寄与している。
pLDDT
AlphaFold2 が出力する1残基ごとの予測信頼度指標。0〜100で表され、90以上は高精度、70未満は構造が不確実と判断される。ユーザは色分け可視化でモデルの信頼できる領域と改良が必要な領域を即座に区別可能。実験構造との比較でpLDDTが良好な相関を示すことが検証済み。データベース検索や機能解析時のフィルタリング指標として活用される。
CASP
Critical Assessment of Protein Structure Prediction は2年ごとに開催される国際コンテストで、未公開構造を予測し精度を競う。独立審査によりアルゴリズムの客観的評価を可能にし、分野の技術進歩を牽引してきた。AlphaFold2 がCASP14で歴史的勝利を収め、問題解決とみなされた。現在は動的構造や複合体部門が新設され、次世代手法の競争が続く。結果データは研究コミュニティへ公開され、ベンチマークとして利用される。
配座空間探索
タンパク質鎖が取りうる全ての立体配置(配座)を探索する計算過程。従来はモンテカルロ法や分子動力学で一部をサンプリングしていたが、AlphaFold2 は学習済みネットワークで高確率領域を直接推定するため効率が飛躍的に向上。配座多様性を扱う新手法として生成モデルや拡散モデルが登場し、複数の低エネルギー状態を同時に出力可能となった。薬物結合やアロステリック制御研究への応用が期待される。
AlphaFold-Multimer
AlphaFold の複合体予測拡張版で、複数配列を連結したMSAと相互情報を入力とする。界面アテンションによりサブユニット間接触を推定し、DockQ指標で従来手法を上回る精度を示す。pTM と interface-pTM が全体および界面品質の信頼度評価に使われる。大規模エンドユーザワークフローを想定し、ColabFold でGPU資源を共有。補体形成、シグナル複合体など医薬ターゲット解析で利用が拡大中。
RoseTTAFold
ワシントン大学が開発した3トラックニューラルネットワーク構造予測モデルで、配列・2D距離行列・3D座標を並列に処理。AlphaFoldと異なる軽量アーキテクチャで高速予測を実現し、デザインワークフローとの統合が容易。初期版は単鎖、最新のAll-Atom版はリガンドも含む複合体まで扱う。オープンソースとして広く採用され、複数手法のアンサンブルによる精度向上にも寄与。教育用にも軽量モデルが提供されている。
バイオ医薬品開発
構造予測AIにより標的タンパク質や抗体の詳細な立体情報が瞬時に得られるため、結合ポケット設計や変異スクリーニングが高速化。AlphaFold のpLDDTを利用して可動ループの安定化部位を同定し、抗体の親和性が向上した例も報告。創薬コストと期間が大幅に削減され、希少疾病やパンデミック対応薬の開発が加速。規制当局もin silicoデータの審査指針作成を検討中。AI駆動型医薬品の時代を後押しする基盤技術となっている。