材料開発・創薬支援における機械学習・深層学習・強化学習 part2
米マサチューセッツ工科大学(MIT)准教授Rafael Gómez-Bombarelli🐾1の言(as of 26年2月12日)[*A-18]によると今は、マテリアルズ・インフォマティクス(MI)の第2変曲点らしい❚補足1❚。ちなみに、第1変曲点は2015年頃という認識らしい。米オバマ政権が、マテリアル・ゲノム・イニシアティブ(MGI)🐾2をぶち上げたのが2011年、ジェフリー・ヒントン他がAlexNetで世界を驚かせたのが2012年であった。今(2026年)は、LLMの科学的推論能力が向上しつつあり、マルチモーダルLLMが科学研究に導入されつつある。それらが、変曲点の裏打ちとなっているようである(ただし、科学的推論能力は、まだまだ不十分である)。
かつては「MIと言えば、物性予測(からの新規材料探索)」だった時代があった🐾3。材料分野❚補足2❚では、2023年にグーグルが、能動学習ベースⓍグラフニューラルネットワーク・ベースのGNoMEを発表してから潮目が変わったように思われる。つまり、予測/探索から生成に移行したように思われる。マイクロソフトも、拡散ベースの生成モデルMatterGenを23年12月(@arXiv)に発表した。肌感としても24年~25年にかけて予測/探索(単体)の研究は少なくなったと感じていた。そこで、MIの現在地を整理してみた。
整理方針は、次のように策定した。CRDS🐾4が2022年4月に発表した『マテリアルズ・インフォマティクスの発展と今後の展望』[*A-19]という資料では、「MIの研究動向」という章が、㊀予測/探索、㊁生成モデル・LLM🐾5、㊂自動化・自律化、という3つの切り口🐾6で構成されている。この3本柱構成を踏襲しつつ2025年までの進化・進歩を付け加え、MIをAI駆動型材料発見として、次のようにアップデートしてみた:㊀☞【1】グラフ・ニューラルネットワーク、㊁☞【2】逆設計、㊂☞【3】自律ラボ。
🐾1 MIの専門家として世界的に知られている(らしい)。出身はスぺインで、化学オリンピックの金メダリスト(2001年)。アラン・アスプル・グジク(当時、米ハーバード大化学教授)の研究室でポスドクを経験。グジクは、VQE(変分量子固有値ソルバー法)の考案者で、Zapata Computing(現Zapata Quantum)の共同創業者。
🐾2 ただ、MGI後の米国で、MIは盛り上がっていないように思われる。AI for Scienceに取り込まれただけかもしれない。
🐾3 その意味で、マトランティスの25年7月31日付けブログ(https://matlantis.com/ja/resources/blog/what-is-materials-informatics/)は、認識が古くないだろうか、と心配になる(大きなお世話であろうが・・・)。
🐾4 国立研究開発法人科学技術振興機構 研究開発戦略センター。「国内外の社会や科学技術イノベーションの動向及びそれらに関する政策動向を把握し、俯瞰し、分析する」機関。
🐾5 文言を変えて、識別モデルを割愛している。識別モデルは主に、与えられた入力(結晶構造、化学組成など)に関連付けられたカテゴリ(超伝導材料、磁性材料など)又は、ラベル(形成エネルギー、臨界温度など)を直接「予測する」ために用いられる。つまり、予測用なので、割愛した。
🐾6 [*A-20]も、切り口は同じと思われる。
❚補足1❚
MITはMIの一大中心地と見做されている。それは、韓国サムソン電子とMITが、全固体電池の電解質材料を数か月で見つけたという2012年の事件ゆえであろうか。この事件のインパクトは、「数か月で」というより、同じ組成の材料(硫化物系材料、リチウム・ゲルマニウム・リン硫化物Li10GeP2S12)を見つけるのに、東京工業大学(当時)とトヨタ自動車が約5年を費やしていた、という処にあった。当時の日本はまだデフレに苦しんでおり、素材産業位しか明るい産業セクターが見当たらなかった。そのため、日本産業界は慌てふためいて、MIを推進することとなった。2018年は日本のMI元年とされる(慌てふためいたわりには遅い)。ちなみに、2019年(11月)には三井住友銀行コーポレート・アドバイザリー本部企業調査部が、マテリアルズ・インフォマティクスによる材料開発という資料を作っている[*A-21]。
しかしMIは、いくつかの理由で尻すぼみになったと思われる(☞【5】考察)。MIT発の著名なモデルは、26年時点で、2021年のCDVAE(Crystal Diffusion Variational Autoencoder)及び2025年のCrysVCD(Crystal generator with Valence-Constrained Design)くらいであろうか。なお、創薬分野であれば、(MITだけで開発したわけではないが)、Boltz-1、Boltz-2あるいはBoltzGenがある。
❚補足2❚
タンパク質であれば、元々予測ツールであったAlphaFold2を使って、タンパク質が生成されるようになった。AlphaFold3では、バックボーンがトランスフォーマーから拡散モデルに変わったことで、より生成寄りのモデルとなっている(という認識)。なお、タンパク質≈創薬分野では、米Chai DiscoveryのChai-1(及び改良型のChai-2)の評価が高いと思われる。基本的にChai-1は、AlphaFold3をマネて作られているようである。
さらに新顔が26年2月10日にお披露目された。グーグル・ディープマインドから(AI創薬をビジネスにするために)スピンアウトしたIsomorphic Labsが、IsoDDEを発表した。IsoDDE=Isomorphic Labs Drug Design Engineである。メイクマネーを目指しているので、IsoDDEの詳細は(論文公開という形式で)明らかにはされていない。代わりに、テクニカル・ペーパー[*A-45]が公開された(その日付が2月10日)。テクニカル・ペーパーによれば、IsoDDEの性能はAlphaFold3を上回る。
【1】グラフ・ニューラルネットワーク
以下では、論文[*A-22]🐾7を基に、グラフ・ニューラルネットワーク(GNN)について整理する。
(0) 概要
改めて述べるまでもないが、結晶データをCNN(畳み込みニューラルネットワーク)などの従来型ニューラルネットワークでモデル化する(=必要十分な情報を持たせる)ことは、困難である。GNNはテンソル構造データではなくグラフ構造データを処理する。GNNの中核となる概念はメッセージ・パッシングである。以下、[*A-20]で取り上げられている最先端GNNを、少し深堀する。
🐾7 中国人民大学と陝西師範大学の研究者が、新規機能性材料開発における逆設計についてまとめたレビュー論文。中国物理学会が発行するChinese Physics Reviewという雑誌に掲載されている。米国物理学会が発行するPhysical Reviewを意識している(ことは間違いない)。
(1) EOSnet (Embedded Overlap Structures net)
1⃣ 概要
米ラトガース大の研究者は、以下のような問題意識を持ってEOSnet[*A-23]を開発した:既存のGNNには、2つの課題㊀,㊁❚補足3❚がある。㊀多体相互作用を捉えるのが困難であること。㊁手動による特徴量エンジニアリングが必要なこと。 EOSnetは、ガウス重なり行列(GOM)フィンガープリント(→2⃣)を、本質的なノード特徴量として導入することで、㊀,㊁に対応する。
2⃣ 技術要素
重なり積分とは、基底関数(原子軌道)の重なり積分を行列要素とする行列である。「ガウス重なり行列(GOM)」とは、基底関数がガウス型であることを言っているに過ぎない。GOMフィンガープリントは、GOMの固有値から導出される。
[*A-23]は、GOMフィンガープリントは、多体相互作用を効率的に捕捉する堅牢な記述子であると主張する。その根拠は、適当な距離でカットオフされた範囲内の全原子ペア間で、自己相互作用を含む重なり積分を計算するからである。また、球面調和関数のような明示的な角度展開を使用する手法と比較して、計算効率が高いと主張する。
3⃣ 性能
㈠ 材料特性予測タスク
電子バンドギャップ予測で、EOSnet は0.163 eVの平均絶対誤差(MAE)を達成した。ベンチマークとしたCGCNN🐾8は0.388 eV、MEGNet🐾9は0.33 eVであった。
🐾8 結晶グラフ畳み込みニューラルネットワーク。GNNを用いて材料特性を予測する最も初期のツールの一つで、距離ベースのGNN。無向多角形グラフを用いて、原子をノード、化学結合をエッジとして表現する。ペアワイズ距離が同一であれば、結合角が異なる分子構造を区別できない。
🐾9 マテリアル・グラフネットワーク。距離ベースのGNN。結晶中の単位胞がノードで、隣接する単位胞がエッジで接続されている。温度、圧力、エントロピーなどのグローバル状態属性をグラフ表現に導入している。ハイパーパラメータ選択の影響を受けにくい、とされる。
㈡ 機械的特性予測タスク
体積弾性率予測で、EOSnetは0.034 log₁₀(GPa)のMAEを達成した。ベンチマークとしたCGCNNは0.054、MEGNetは0.050であった。せん断弾性率予測で、EOSnetは0.072log₁₀(GPa)のMAEを達成した。CGCNNは0.087、MEGNetは0.079であった。
㈢ 分類タスク
金属/非金属分類でEOSnetは、97.7%の正解率であった。CGCNNは95.0%、MEGNetは90.6%であった。
❚補足3❚
㊀と㊁について若干補足すると、つぎのようになる:㊀の補足・・・従来のGNNモデルは、距離ベースのメッセージ・パッシングに主に依存している。つまり、ペアワイズ原子相互作用のみを符号化しているため、多体相互作用を捉えることが、本質的に困難である。㊁の補足・・・現在のGNNは通常、研究者が『原子番号、価電子、電気陰性度、共有結合半径など』の化学的特性をノード特徴量として選択することを要求する。
(2) CTGNN(Crystal Transformer Graph Neural Network)
1⃣ 概要
中国・復旦大学他の研究者は、以下のような問題意識をもってCTGNN(結晶トランスフォーマーGNN)[*A-24]を開発した:㊀既存のGNN(CGCNN(🐾8参照)やMEGNet(🐾9参照)を例示)は距離ベースのGNNであり、原子間の角度といった”より豊富な幾何学的情報”が欠落している。㊁トランスフォーマー+GNNは学習が難しい。CTGNNは、3つの技術要素を導入し(→2⃣)、㊀,㊁に対応する。
2⃣ 技術要素
㈠ エッジ特徴量の拡張 ←㊀対策
距離に加えて、角度もエッジ特徴量とする。角度は、原子iと原子jを結ぶ結合ベクトルと(x,y,z)座標軸とが成す角度である。角度は、事前に定義されたビンに離散化され、ワンホットライクな表現を使用して符号化される。
㈡ デュアル・トランスフォーマー構造 ←㊁対策
2つのトランスフォーマー層を使用するデュアル・トランスフォーマー構造が、結晶内および原子間の関係を包括的にモデル化する。2つのトランスフォーマー層は、ノード特徴量とエッジ特徴量をそれぞれ別個に処理する。具体的には、多頭自己注意機構を採用した「結晶内トランスフォーマー層」がノード特徴量を処理する。自己注意機構を採用する「原子間トランスフォーマー層」は、エッジ特徴量を処理する。
㈢ 特徴量の統合 ←㊁対策
原子特徴量vは、隣接原子の原子特徴量及びエッジ特徴量と連接される→zと表記。vはシグモイド関数σと活性化関数gの直積σ(z)Ⓧg(z)を使って、v=更新前のv+∑σ(z)Ⓧg(z)、と更新される。
3⃣ 性能
CTGNNは、ペロブスカイト・データセットとJARVIS-DFTデータセット🐾10で評価された。予測対象とした特性は、形成エネルギー(ただし、ペロブスカイト・データセットのみ)とバンドギャップである。ベンチマークはCGCNNと MEGNet。
㈠ 形成エネルギー
CTGNNは0.013 eV/atomの平均絶対誤差(MAE)を達成した。CGCNNは0.027。MEGNetは0.032であった。CTGNNのR²スコアは0.996であった。
㈡ バンドギャップ|ペロブスカイト・データセット
CTGNNは0.156eVのMAEを達成。CGCNNは0.285。MEGNetは0.296であった。CTGNNのR²スコアは0.960であった。
㈢ バンドギャップ|JARVIS-DFTデータセット
CTGNNは0.469eVのMAEを達成。CGCNNは0.531。MEGNetは0.493であった。CTGNNのR²スコアは0.910であった。
🐾10 JARVIS(Joint Automated Repository for Various Integrated Simulations)は、米国立標準技術研究所(NIST)が開発・運営するデータ駆動型プラットフォームで、大規模なデータベースを提供する。 JARVIS-DFTデータセットは、DFTに基づいて計算された材料特性で構成されるデータセット。
(3) SA-GNN(Self-Attention Graph Neural Network)
1⃣ 概要
中国・合肥工業大学他の研究者は、以下のような問題意識をもってSA-GNN(自己注意機構付きGNN)[*A-25]を開発した:㊀CGCNNは、複雑な結晶構造や原子間の非局所的な相互作用をモデル化する場合のパフォーマンスが限られる。㊁MEGNetは、グローバルな依存関係をモデル化するメカニズムが欠如しており、特定の複雑な問題に対しては、より多くの深度と計算リソースが必要となる。SA-GNNは、多頭自己注意機構を組み込むことで、㊀,㊁に対応する。
2⃣ 技術要素
SA-GNNは、入力データをエッジ、ノード、およびグローバル特徴量の3つに分割する。グラフ畳み込み層モジュールは、㈠「ノード、エッジ及びグローバル特徴の集約、ノード表現の学習」に加えて、㈡「特徴量次元間の関連情報を抽出し、特徴量間の自己相関と相互相関を調査する」ために使用される。㈡により、モデルによる特徴量相関の理解が向上する。
また、多頭自己注意機構により、ノード表現層はグラフ構造全体のグローバル情報を符号化できる。このため、モデルの表現能力と性能が向上する。
3⃣ 性能
4つのデータセット🐾11を使って、バンドギャップ、総エネルギー、吸着エネルギー、形成エネルギーを予測した。ベンチマークは、CGCNNとMEGNet🐾12。
🐾11 QMOF(Quantum Metal–Organic Framework)データベース=バンドギャップ。文献から金属合金表面のデータセット=吸着エネルギー。文献からのPt(白金)データ=総エネルギー。Material Project=形成エネルギー。
🐾12 正確にはSchNetとMPNN(プレーンなGNNという意味だと思われる)も含まれているが、割愛した。
㈠ バンドギャップ
SA-GNNは、0.222eVのMAEを達成。CGCNNは0.246。MEGNetは0.232。
㈡ 総エネルギー
SA-GNNは、0.153eVのMAEを達成。CGCNNは0.142。MEGNetは0.185。
㈢ 吸着エネルギー
SA-GNNは、0.056eVのMAEを達成。CGCNNは0.07。MEGNetは0.079。
㈣ 形成エネルギー
SA-GNNは、0.044eVのMAEを達成。CGCNNは0.047。MEGNetは0.051。
(4) Kolmogorov-Arnold Graph Neural Network(KA-GNN)
0⃣ KANについて
コルモゴロフ・アーノルド(KA)表現定理とは、「多変数連続関数は、1変数連続関数の和で表現可能」という驚くべき定理である。機械学習の言葉を使うと、「高次元関数の学習は、1次元関数の多項式数の学習に帰着する」となる。ただし、当該1次元関数は、ほとんどの場合滑らかでなく、学習できないと考えられていた。つまりKA表現定理は、理論的には美しくとも、実用性はない、と考えられていた。ところが、やったら出来てしまった。コルモゴロフ・アーノルド・ニューラルネットワーク(KAN)層が2つまでだと上手く行かないが、そこで諦めず根性を出して、2層超にすると、上手く行ったのであった。
雑に言うと、(オリジナルの)KANは、Bスプライン関数とMLP(多層パーセプトロン)の組み合わせであり、両者の「良い所取り」をして、両者の弱点を回避している。KANについては、こちらを参照。
1⃣ 概要
中国の山東大学他の研究者は、コルモゴロフ-アーノルド・ニューラルネットワーク(KAN)をGNNに統合したフレームワークKA-GNN を提案した[*A-26]。研究動機としては、KANをGNNに統合してみたらどうなる?、というものであろうと推測。なお本研究は、KANをGNNに統合した初の試みとされる。
KA-GNNフレームワークは『共有結合と非共有結合の両方の相互作用』を捉える豊富なグラフとして分子を表現する。各原子は、原子番号、半径、電気陰性度などの原子特性を符号化する92次元の特徴量ベクトルを持つノードとなる。エッジは、化学情報と幾何学的情報の両方を符号化する21次元の特徴量ベクトルを持つ。この包括的な表現により、KA-GNNは化学的特性に影響を与える分子相互作用の複雑な3次元的性質を捉えることができる(と主張する)。
2⃣ 技術要素
㈠ フーリエ級数ベース
KA-GNNにおけるKANは、フーリエ級数ベース🐾13である。異なるKAN基底関数(Bスプライン関数、多項式❚補足4❚、フーリエ級数)を比較した結果、フーリエ級数が精度と計算効率の両方で一貫して他の基底関数を上回ったため、フーリエ級数が選択された。フーリエ級数が優れている理由は、「(フーリエ級数が)分子構造や化学相互作用に内在する、周期的かつ複雑なパターンを捉えることに適しているから」と(という若干ステレオタイプな内容で)説明されている。
🐾13 0⃣でも述べたように、オリジナルのKANは基底関数にBスプライン関数を使っていた。次に、基底関数が「ヤコビ多項式、チェビシェフ多項式、ルジャンドル多項式」等に拡張され、最終的(?)にフーリエ級数にまでたどり着いた。ウェーブレットも使われている。
❚補足4❚
変数(入力ベクトル)の線形結合(つまり、∑ℓ∑k係数×変数)で表されるという意味での多項式。線形結合係数は、学習可能なパラメーターで初期値は、「平均0、分散σ」の正規分布からサンプリングされる。ここで、σ=1/((L+1)×K)。LとKは、以下の通りである:総和∑ℓはℓ=1~Lにわたって行われる。∑kはk=1~Kまで行われる。
なお、フーリエ級数:∑∑係数c×cos(x)+係数s×sin(x)、の係数c及び係数sも、扱いは同じ。学習可能パラメーターで初期値は、「平均0、分散σ」の正規分布からサンプリングされる。σも同じ。
㈡ KANの使用
KA-GNNでは、KANは「初期ノード表現、メッセージ・パッシング、読み出し」という3つの段階で使用されている。初期ノード表現では、原子の特徴と平均化された隣接エッジ情報の両方を処理するKANを使って、表現力が豊かな特徴量ベクトルが作成される。メッセージ・パッシングでは、KANが接続されたノード間の情報交換を強化する。読み出しではKANを使用して、集約されたノード特徴量を、分子特性予測に変換する。
3⃣ 性能
㈠ ROC-AUC
KA-GNNフレームワークは、MoleculeNet🐾14の7つのベンチマーク・データセット(生物物理学領域(MUV、HIV、BACE)🐾15および生理学領域(BBBP、Tox21、SIDER、ClinTox)🐾16)で広範に評価された。つまり、材料というよりも医薬品が念頭にあると思われる。評価には主要な指標としてROC-AUCが用いられ、データセット全体で化学的多様性を確保するために、スキャフォールド分割が採用された。KA-GNNは、すべてのベンチマーク・データセットにおいて、既存の14モデル🐾17と比較して一貫して優れた性能を達成した。KA-GCN🐾18がMUV(0.834)、BACE(0.890)、BBBP(0.787)で最も高いROC-AUCを達成した(括弧内に数値を記した)。KA-GAT🐾19は、HIV(0.823)、Tox21(0.800)、SIDER(0.847)、ClinTox(0.991)で最も高いROC-AUCを達成した。
🐾14 米スタンフォード大学で作成された、分子機械学習のための大規模ベンチマーク・データセットらしい。医薬品や材料の発見で一般的に使用されるタスクの一部を踏襲しており、分子の薬効・毒性予測を含む分類タスク、分子の溶解度や電気的特性などの予測を含む回帰タスクが含まれる(出所:https://jp.newsroom.ibm.com/2025-01-16-blog-foundation-models-for-materials)。
🐾15 MUV=Maximum Unbiased Validation:バイアスを最大限に抑制した生物活性データのセット。HIV=HIVウイルスに対する化合物の活性を分類するデータセット。BACE=アルツハイマー病治療薬の標的となるBACE-1(アミロイド前駆体タンパク質βサイト切断酵素1)阻害剤の化合物データセット。
🐾16 BBBP=Blood-Brain Barrier Penetration:化合物が血液脳関門(BBB)を通過するかどうかを表す二値データからなるデータセット。Tox21 =Toxicology in the 21st Century:12種類の核内受容体やストレス応答経路に対する化合物の毒性データからなるデータセット。SIDER=Side Effect Resource:市販薬の副作用に関するデータセット。ClinTox=米食品医薬品局承認薬と、臨床試験で毒性が原因で失敗した化合物の比較データからなるデータセット。
🐾17 ①D-MPNN、②AttentiveFP、③N-GramRF、④N-GramXGB、⑤PretrainGNN、⑥GROVE_base、⑦GROVE_large、⑧GraphMVP、⑨MolCLR、⑩GEM、⑪Mol-GDL、⑫Uni-mol、⑬SMPT、⑭GNN-SKAN。
🐾18 KA-GNNのバリアントで、KANベースのグラフ畳み込みニューラルネットワーク。
🐾19 KA-GNNのバリアントで、注意スコアを使ってノードが更新される。
㈡ 計算速度
フーリエ級数ベースのKANはBスプライン関数ベースのモデルと比較して、全てのデータセットで、より速い学習時間を達成する(100エポックの実行時間で3秒くらい速い)。多項式ベース・モデルよりも速いが、その差は僅かである。
【2】逆設計(Inverse Design)
(0) 案内
探索から逆設計への移行は、不可逆な動き(パラダイムシフト)であろう。逆設計とは、物性から構造を導出する設計手法である。材料の文脈では、「構造≒分子構造、結晶構造」という理解で良いだろう。2021年に書かれたレポート[*A-27]には、「逆問題MIシステム」という文言を見つけることができる。5年前には逆設計という言葉は馴染み薄だったようである。23年の研究紹介記事[*A-28]には、逆設計という文言が現れている。以下では、論文[*A-22]を基に、逆設計に関して(1)~(4)という切り口で簡潔に整理する:(1)設計と生成、(2)予測/探索、(3)検証、(4)テスト。
(1) 「設計と生成」における課題
掲題につき、以下のような課題がリストアップされている。
❶ シンプルに、生成モデルの性能を上げる必要がある。AI によって生成された材料の構造は、安定した基底状態にないことが多い。
❷ 化学組成に基づく、生成モデルが足りない。
❸ 部分的に既知の構造または化学式が入力として与えられた場合に、完全な構造または化学式を生成するモデルが必要である。
➍ 新しい構造を生成するための空間群番号🐾20を直接制御できるアルゴリズムは未だ開発されていない。
❺ アモルファス材料や準結晶に特化した生成モデルが、未だ存在していない。
❻ ベンチマークが不足している。
❼ 高エントロピー合金などの一部の複雑な材料に関するデータが、まだ不足している。
❽ AIにより発見されたが、合成困難・製造困難な材料の扱い(データベースに加えるか否か)。
🐾20 3次元の空間群は530種類もある。このため、番号で区別(管理)されている。空間群は、結晶構造の対称性を記述するために用いられる。
(2) 「予測/探索」における課題
掲題につき、以下のような課題がリストアップされている。
❶ 高精度で予測することが困難な物性が、未だ存在する。
❷ 材料の種類によっては利用可能なデータセットが限られているという課題は、能動学習により緩和できるが、(能動学習に)手動作業が多く残っている。
❸ 材料性能に対するドーパントと構造の影響を正確に予測することは、依然として困難である。
(3) 「検証」の方向性
候補材料の検証に適用される計算は、ほとんどDFT(密度汎関数理論に基づく)計算である。DFTにおける、㈠交換相関汎関数を機械学習で構築する試み🐾21、㈡ハミルトニアンを機械学習で予測する試みがある。㈠は、DFT計算対象にmore適合した交換相関汎関数を構築して、計算精度・予測精度を上げることが動機である。機械学習モデルを活用することで、近似能力がより高い複雑な汎関数を構築することが期待できる。
㈡は、計算コストの低減が動機である。電子ハミルトニアン計算で最も高コストな「2電子反発積分🐾22の計算コスト」は、何も工夫しなければ、電子数Nに対してO(N4)となる。これは法外なコストで、O(N)とする工夫が求められる🐾23。㈡では、中国の清華大他が開発したDeepH[*A-29](22年6月@nature computational science)及び中国の復旦大学他が開発したHamGNN[*A-30](23年10月@npj computational materials)が知られている。
DeepHはグラフ・ニューラルネットワークを使ってハミルトニアン(行列)の行列要素を学習する。HamGNNは、「局所座標系を使ったDeepHは長距離相互作用への対応が困難で、厳密な不変性に欠けていた」という問題意識をもとに開発された。具体的には、HamGNNはE(3)同変グラフニューラルネットワークを使って、ハミルトニアン(行列)を行列要素を学習する🐾24。ちなみに、DeepHにはDeepH2やDeepH3もある。
🐾21 機械学習分子動力学法(MLMD)の機械学習ポテンシャル(MLP)をイメージすると、肚落ちが良いかもしれない。ただし、MLP(というかMLMD)の動機は、計算コストの削減であり、対象にmore適合するようにカスタマイズという動機ではない(。それ故に、盛り上がっていないのかもしれない。もっとも、交換相関汎関数を機械学習で構築する試みも、盛り上がっていないと思われる)。
🐾22 2電子反発積分は、4重積分である(1電子積分は2重積分)。テンソルネットワーク(テンソルハイパー縮約:THC)を使うと、2重積分の組に分解できる(らしい)。なお、2電子反発積分は、2電子クーロン反発積分と2電子交換反発積分からなる。
🐾23 O(N)とする工夫、つまり線形でスケールさせる方法は、もちろん他にもある。
🐾24 ハミルトニアン行列の行列要素を、クレブシュ・ゴルダン係数と既約球面テンソルの線形結合として表現している。こうすることで不変性が(より)厳密に導入されるらしい。
(4) 「テスト」の方向性
(機械学習モデルによる)予測結果と実験的合成結果を統合するワークフローは、限られたデータセットで複雑な材料を研究するための貴重なツールである。このため今後の実験フェーズでは、実験セットアップからのリアルタイム・データが組み込まれ、予測モデルが動的に調整されると推測している。つまり自然に、自律型実験システムへ進化すると推測している。
【3】自律ラボ
最初の自律ラボ(若しくは自動運転ラボ、SDL)は、米ローレンス バークレー国立研究所の A-Lab プラットフォームとされている(natureに論文[*A-40]が掲載された日時で言うと、23年11月29日)。このプラットフォームは、機械学習モデルを使用して、粉末回折データをリアルタイムで分析することにより、無機化合物の初の完全自律型固体合成を達成した。以下、自律ラボに関するレビュー[*A-31]を基にして、簡単に整理した。
(1) 総論
1⃣ 現在の傾向
代表的な自律ラボを比較分析することで、明確な傾向㈠、㈡が2つ見えてきた。
㈠ 一つ目は、ロボット・モジュール、リアルタイム特性評価、認知エンジンを1つのワークフローに組み合わせて、これまで以上に高レベルの統合を目指して進んでいる。この傾向を踏まえると、自律ラボは、2 つの主要な方向㊀、㊁に沿って進んでいくことが考えられる。㊀ハードウェアの統合と並列化を強化して、実験のスループットを大幅に向上させる方向。㊁複雑な制約を超えて、事前知識と推論を組み込む、より深い認知機能に向かう方向である。
㈡ 二つ目は、「科学的信頼は、透明性と検証可能な意思決定プロセスに依存する」というコミュニティの認識を反映して『再現性と解釈可能性』が速度とスループットと同じくらい重要になってきている。これは課題でもあり、3⃣で再度取り上げる。
2⃣ 将来への期待・拡張
㈠ 文献から研究室へ
自律ラボは、もはや孤立した自動化プラットフォームではない。科学文献と研究室の実践の橋渡しとなる知識モジュールとして、テキスト処理アルゴリズムを組み込んでいる。そうすることで、人間の知識とロボットの動作の間の情報のボトルネックが軽減され、テキストベースの知識が実用的な実験指示に効果的に変換されている。
標語的に述べると、自動化された「文献から研究室へ」というパイプラインの可能性が開かれる。このパイプラインでは、AI が科学コーパスを継続的に消化し、有望な合成戦略を特定し、人間の介入を最小限に抑えて実験的に検証する。構造化データセットと非構造化テキスト情報の両方から学習できるこの機能は、次世代自律ラボの基礎となる可能性がある。
㈡ マルチエージェント・アーキテクチャ
上述した、自動化された「文献から研究室へ」というパイプラインを裏打ちする技術として、MAPPS(計画、物理学、科学者を統合するマテリアル エージェント)などのマルチエージェント・アーキテクチャがある。MAPPS は、計画エージェント、物理ベースのシミュレーター、および人間参加型フィードバック・モジュールを一貫したフレームワークに統合することで、エラーに対する回復力を実現し、材料提案の新規性を向上させる。
以前のLLMベース・プラットフォームとのベンチマークでは、MAPPS が閉ループ実験の安定性を 5 倍向上させると同時に、考慮される候補材料の多様性を拡大することが示された。局所最適化に引き寄せられることが多い、シングル・エージェント・アーキテクチャとは異なり、MAPPS はより広い設計空間の探索を促進し、時期尚早な収束のリスクを軽減する、とされる。
㈢ ビジネス
今後5~10年の時間軸で考えると、自律ラボは、工業生産もモデリング及び最適化できる「研究所と生産ラインとが統合されて完全に機能する」デジタル ツイン向けに開発されることが期待される。(材料ではなく医薬品事例であるが)米製薬大手ファイザーはTelescope Innovations🐾25と、製薬研究の加速を目的とした自律ラボワークフロー開発を目指す複数年の契約を交わした🐾26。また、IBMのRoboRXNプラットフォーム🐾27は、複雑な化学合成を最適化するために自律化学システムと統合されており🐾28、シンジェンタ🐾29などが自社の化合物発見パイプラインに組み込み始めている(と[*A-31]には書いてある)。こちらも、無機材料というよりは有機材料であろう。
🐾25 製薬および化学業界向けにスケーラブルな製造プロセスとツールを開発するカナダの化学技術企業。化学プロセスの開発を加速するインテリジェントな自動化プラットフォームを構築しているらしい。https://telescopeinnovations.com/
🐾26 Telescope Innovations and Pfizer Sign Master Collaborative Research Agreement(24年7月31日)、https://telescopeinnovations.com/telescope-innovations-and-pfizer-sign-master-collaborative-research-agreement/ なお、韓国医薬品・バイオ医薬品製造協会(KPBMA)に、該社プラットフォームが導入された(25年12月9日)。
🐾27 AIとロボットを組み合わせて、クラウド上に構築されたヴァーチャル・ラボ。化学構造をクラウド入力→AIが必要な材料と合成手順を予測→ロボットに当該予測を送信→試作を実行。試作が完了したら、ロボRXNが結果と共に報告書を返信する。
🐾28 スイスAtinaryの自律ラボを活用し、AI、機械学習、ロボティクスを統合したワークフローを構築したことが、https://atinary.com/use-cases/ibm-research/に書いてある。
🐾29 シンジェンタはスイスに本拠を置く、農薬・種苗(種子)メーカーで、2017年に中国化工集団が買収した。スイス製薬企業ノバルティス(←スイス・チバガイギー+スイス・サンド)の農業事業と英製薬企業アストラ・ゼネカ(←スウェーデンのアストラ+英ゼネカ)の農薬事業が統合して、2000年に誕生した。
3⃣ 現状の課題と対策
自律ラボには、データの標準化、モデルの説明可能性、サイバーセキュリティ・リスクという基本的な課題が存在する。モデルの説明可能性については、(新味は全くない)2つの対策がとられている。1 つはモデルを本質的に解釈可能にすること (たとえば、より単純な代理モデルや、物理的に意味のある記述子の使用)、もう1つは学習後に AI の出力を分析する事後説明である。一般的な事後説明には、どの入力パラメーター(組成、温度、処理時間)が結果に最も影響を与えたかを特定する特徴量重要度スコアと、モデルが現在のケースに類似した過去の実験またはデータポイントを強調表示する例ベースの説明(example based explanation)が含まれる。たとえば、SHAP や LIME などのツールは、予測(たとえば、予測された最適な材料組成)を特定の入力要素に帰属させることができ、研究者が AI が特定の実験を提案する理由を理解するのに役立つ。
(2) 各論:ナノマテリアルに対する自律ラボ・プラットフォーム
1⃣ AlphaFlow(2023年)
複雑な多段階の化学を自律的に発見できる自己駆動型流体・自律ラボ[*A-32]。米ノースカロライナ州立大学他が開発した。強化学習とベイズ最適化アルゴリズムが使用されている。AlphaFlow🐾30は、パラメーターに関する事前知識がなくても最大40 個のパラメーターを備えた、従来のシーケンスを上回る新しい多段階反応ルートの特定と最適化に成功した(と主張)。
🐾30 かつて(富士総合研究所(現、みずほリサーチ&テクノロジーズ)が開発した)α-FLOWという国産の汎用3次元流体解析システムがあった。
2⃣ Rainbow(2025年)
有名であり、代表的な自律ラボ。メタルハライド・ペロブスカイト・ナノ結晶(MHP NC)の混合変数高次元地形を、効率的にナビゲートするマルチロボット自律ラボ[*A-33]。米ノースカロライナ州立大学他が開発した。Rainbow(Robotic and AI-assisted Nanocrystal Bandgap Optimization Workflow)は、並列化された小型バッチ反応器、ロボットによるサンプル処理、連続的な分光フィードバックを使用して、MHP NC光学性能を自律的に最適化する。最適化には、多目的ベイズ最適化アルゴリズムを用い(てパレート最適組成を特定し)ている。
3⃣ GPT+A*(2025年)
GPTモデルを使用してメソッド/パラメーターを取得し、最適化アルゴリズムとして「A*アルゴリズム」🐾31を実装した自律ラボ[*A-34]。中国・華南理工大学他が開発した。実証実験では、Au(金)ナノロッドの合成パラメーターと、Au ナノスフェア/Ag(銀)ナノキューブの合成パラメーターを包括的に最適化した。GPT+A*は、A*をOptuna🐾32やOlympus🐾33と比べるて、必要な反復回数が大幅に少ないことを確認したという結論のようである。
🐾31 最短経路探索アルゴリズム。
🐾32 Optunaは日本のプリファードネットワークスが開発した、機械学習向けハイパーパラメータ自動最適化アルゴリズム。
🐾33 米ハーバード大他が開発したソフトウェア パッケージ[*A-35]。確率的深層学習モデルを介してエミュレートされた実験に対する、最適化アルゴリズム・ベンチマーク用のフレームワークを提供する。Olympusには、化学および材料科学から実験的に得られたベンチマーク セットのコレクションと、ユーザーフレンドリーな Python インターフェイスを介して簡単にアクセスできる一連の実験計画戦略が含まれている。
4⃣ ScatterLab(2025年)
リアルタイムの全X線散乱データを標的となる原子構造に適合させることで、ナノ粒子を自律的に合成する自律ラボ[*A-36]。デンマーク工科大他が開発した。最適化アルゴリズムには、疎軸整列部分空間ベイズ最適化アルゴリズム(SAASBO)❚補足5❚を使用している。なお、獲得関数には、期待改善量(EI)の対数であるlog EIを使用している。
ScatterLabは、事前知識なしに、以下㊀、㊁のような化学的に合理的な決定を下した:㊀システムは一貫して合成からエタノールを除外することを好んだ。これは、グリセロール・ベースのシステムでの、より速いナノ粒子形成を示唆する文献報告と一致している。㊁5ナノmの十面体から10ナノmの(球状)面心立方構造に移行する際、アルゴリズムは合理的に水酸化ナトリウム濃度を増加させ、クエン酸ナトリウム濃度を減少させた。これは、より大きな粒子成長を促進するための確立された化学的原理と一致する。
❚補足5❚
高次元ベイズ最適化(高次元BO)アルゴリズムの一種。説明変数が多くなる(高次元になる)と、ベイズ最適化の性能は落ちるとされる。原論文[*A-37]には、「未知の目的関数のモデル化に関連する疎な部分空間を迅速に特定でき、サンプル効率の高い高次元BOが可能になる」とある。疎な軸に整列した部分空間上で、ガウス過程ベースのベイズ最適化アルゴリズムを走らせるらしい。
[*A-37]は、問題固有のハイパーパラメーターを設定することなく、いくつかの合成問題および現実世界の問題で優れたパフォーマンスを達成できることを実証した、とする。
5⃣ GEMS(General Experimental Management System)(2026年)
理化学研究所、筑波大学、東京科学大学は、実験を自律運用するソフトウエア基盤GEMSを開発した、と発表(プレスリリースは26年3月18日、論文[*A-46]@Digital Discoveryは同10日オンライン公開)。実験手順を「決定性有限オートマトン(DFA)」に基づいて捉え直したことで、条件分岐や繰り返しを含む実験であっても、自律的な運用が期待できると主張。
【4】為参考:生成モデル
(0) 独白
米メタと蘭アムステルダム大学が開発したFlowLLM([*A-38]@arXiv、24年10月31日)について簡単にまとめる。FlowLLMの登場は、24年10月と比較的新しいものの、1年以上前である❚補足6❚。生成モデル単体で云々という時代ではなくなっている証左であろうか。
❚補足6❚
2025年産モデルとしては、米MIT他のCrysVCD[*A-41]、中国・華南理工大学他のAlloyGAN[*A-42]がある。なお、両者とも、逆設計を十分に意識している。
CrysVCD(Crystal generator with Valence-Constrained Design)の問題意識・開発動機は、「逆設計の既存アプローチは、重要な化学的制約を無視していることが多い。このため、化学的に無効な構造につながる可能性がある」。CrysVCDは、化学的制約を生成プロセスに直接統合することで、先の課題を解決する。具体的には、トランスフォーマー・ベース言語モデルを用いて化学的制約を満たす化学組成を生成した後、拡散モデルを用いて結晶構造を生成する。CrysVCDは、85%の熱力学的安定性と68%のフォノン安定性を実現する、と主張。
AlloyGANの問題意識・開発動機は、「データ不足」である。AlloyGANは、「LLM支援テキストマイニングと、条件付き敵対的生成ネットワーク(CGAN)を統合し、データの多様性を高める」ことで、先の課題を解決する。金属ガラス🐾41の場合で、AlloyGANは実験との差異8%未満で、熱力学的特性を予測した、と主張する。
🐾41 原子が規則正しく並んでいない非晶質の金属。過冷却を経て固化するため緩やかな冷却が可能となり、望みの形に加工成形することができる(らしい)。また、強度、弾性、耐摩耗性、耐食性等において優れた特性が期待されている(らしい)。
(1) 概要及び開発の動機
結晶材料の生成は、次のような独特な計算上の課題を有する。つまり結晶材料は、「離散的な構成要素並びに、連続変数」の両方を通じて表現される必要があり、それぞれ異なるモデリングアプローチを要求する。拡散モデルやフローマッチング・アプローチを含む「デノイズ・モデル」は『連続変数』の処理に優れ、結晶構造に固有の物理的対称性を自然に組み込むことができる。しかし、デノイズ・モデルは『離散的な構成要素(原子の種類)』予測に苦戦し、自然言語による条件付けを統合するために特殊なアーキテクチャを必要とする。一方、自己回帰型LLM(大規模言語モデル)は、離散的な構成要素のモデリングにおいて強力な性能を示す。しかし、LLMは(有限精度トークン化を通じて)連続値を表現する際に精度上の制限に直面する。
FlowLLMの開発動機は、これらの相補的なアプローチを相乗的に組み合わせることができるという認識から生まれている。LLMは、離散的な構成要素(原子の種類)と近似的な連続変数を捉える「化学的に情報に基づいた基本分布」を提供できる。リーマン多様体フローマッチング(RFM)❚補足7❚は、結晶対称性を尊重しながら高精度で連続変数を洗練できる。このハイブリッド・アプローチ❚補足8❚は、各方法の個々の弱点に対処しながら、それぞれの強みを増幅させる良い所取りである。
❚補足7❚
(プレーンバニラな)フローマッチング→リーマン多様体フローマッチング は、結晶構造が特有の構造(対称性、周期性)を持つから、データ空間をユークリッド空間ではなく、リーマン多様体と考える方がより適している、と考えれば良いだろう。尚、フローマッチングは、「最適輸送」の考え方を取り入れることで、ノイズからデータまでの移動経路を直線にできるため、拡散モデルに比べて生成速度が速い、とされる。なおRFMでは、リーマン多様体を考えているのだから、直線は測地線になる。
❚補足8❚
MatterGenも2段階のプロセスで動作する(ので、ハイブリッド・アプローチと言えるだろうか)。第1段階では、事前学習済みのベースモデルを使って、安定かつ多様な材料を生成する。第2段階では、MatterGenはアダプタ・モジュールを用いてベースモデルを追加学習する。アダプタ・モジュールは、特定の化学組成、対称性要件、望ましい電子的、磁気的、機械的特性に基づいたカスタマイズを可能にする。このカスタマイズ可能性によりMatterGenは、材料発見のための汎用性と有効性を兼ね備えたツールとなっている、見做されている。
(2) FlowLLMの技術的構成要素
0⃣ セットアップ
FlowLLMは、結晶材料生成における離散的な構成要素と連続変数の両方に、体系的に対処する2段階の生成プロセスを実装している。FlowLLMでは、結晶材料をタプルc = (a, f, ℓ)として表現する。ここで、aは原子の種類(離散的な構成要素)を表し、fは単位セル内の分数座標(連続変数)を示し、ℓは辺の長さと内部角度を含む格子パラメータ(連続変数)を指定する。
1⃣ LLMのフェーズ
LLMには、メタのLLaMA-2モデルを採用する。計算効率のために低ランク適応(LoRA)を使用する。結晶構造は、連続値が固定精度に離散化された文字列表現にトークン化される。座標は小数点以下2桁、辺の長さは1桁、角度は整数で表現される。このトークン化は、LLaMA-2が数字を桁のシーケンスとして処理する能力を活用しつつ、モデルの広範な事前学習を通じて化学的妥当性を維持する。
LLMの学習プロセスでは、結晶構造データセットで再学習が行われる。この際、材料は文字列として表現され、必要に応じて化学式などがプロンプトによって条件付けされる。サンプリング中、材料は逐次的な次トークン予測(Next Token Prediction)によって生成され、温度と核サンプリング(top_pサンプリング)が出力の多様性を制御する。無効な構造は稀であり、生成プロセス中に拒否される。
2⃣ RFMのフェーズ
次に、LLMが生成した構造を精緻化するために、リーマン多様体フローマッチング(RFM)が実装される。RFMは、LLMの学習済み分布を目標データ分布に近似するように写像する、連続的でパラメトリックな微分同相写像(フロー)を定義する。この微分同相写像は、リーマン多様体および結晶構造に適合させた条件付きフローマッチング目的関数を使用して、時間依存ベクトル場を学習することで生成される🐾34。なお、LLMが出力してRFMに渡す分布は、(お決まりの)一様分布や正規分布ではなく、対象問題に適した分布であるため、学習速度が速くなる、とされる。
RFMコンポーネントは、各原子の分数座標を平坦な3次元トーラスTの積として扱い、周期境界条件を尊重しながら測地線を計算する。格子パラメーターは複合的なアプローチで処理される。長さはユークリッド変数として扱われる一方、角度はロジット関数を用いて境界制約を管理するため、制約のない空間にマッピングされる。
E(n)同変GNNから派生し、分数座標向けに修正されたGNNアーキテクチャが速度場をパラメーター化する。このGNNは、メッセージ・パッシングを通じて原子置換に対する同変性を本質的に強制し、相対変位と格子表現の慎重な特徴量化を通じて、並進と回転に対する不変性を維持する。
🐾34 [*A-38]は、次のような限界を認識している:現在のFlowLLMアーキテクチャは、可微分性を必ずしも実現できない。つまり、現在のFlowLLMアーキテクチャでは、特定の目標特性を持つ材料を生成出来るとは限らない。
(3) 性能
0⃣ セットアップ
FlowLLMは、CDVAE🐾35、DiffCSP🐾36、FlowMM🐾37、及びCrystal LLM🐾38と比較された。データセットには45,231の準安定無機結晶材料を含むMP-20データセットを使用した。FlowMMとCrystal LLMを比較対象にしているところが、若干セコい(と感じてしまう)。
🐾35 結晶拡散変分オート・エンコーダ(自己符号化器)。初期の著名な生成アルゴリズム。米MITが開発した。結合同変拡散とSE(3)同変GNNを組み合わせ、順列、並進、回転、周期不変性を維持しながら、周期境界を越えた相互作用を明示的に埋め込む。さらに、CDVAEは、より現実的な物質構造を生成するためにVAE復号器として、ノイズ条件付きスコアネットワークを導入し、ランジュバン動力学を用いて生成プロセスを改良する。
🐾36 CSP(結晶構造予測)に特化したアルゴリズム。中国の清華大学他が開発した。周期的なE(3)不変性を満たす結晶構造を生成し、並進、回転、周期性における安定性を保証。ノイズ除去モデルとメッセージパッシングを用いて予測精度を向上させる。
🐾37 メタが開発したRFMベースのモデル。FlowLLMの先祖という理解で良いだろう。
🐾38 メタのLLaMA-2を再学習して、安定した物質を生成した[*A-39]という理解。スタンフォード大学・人間中心AI研究所(HAI)が発行したAI Index Report 2025(25年4月7日公開)第5章 科学と医療 5.6 AI Foundation Models in Scienceにおいて、注目すべきモデルとして取り上げられた9つのモデルの一つ。
1⃣ 熱的安定性
最も重要な成果は、FlowLLMの『安定率』が高いことである。ここで言う『安定率』とは、DFT緩和後に凸包上のエネルギーが0 eV/原子未満である生成材料の割合であり、熱力学的安定性を示す🐾39。FlowLLMは17.82%であった。この値は従前の最良値FlowMMの5.06%と比較して3倍以上の改善を表している。最終的に合成可能・製造可能な材料(結晶)は、熱力学的に安定している。つまり、FlowLLMが熱的に安定した材料をより多く生成したということは、実際に合成可能・製造可能な材料をより多く生成できる、ということを意味する。
🐾39 新規材料生成モデルの評価において、熱力学的安定性の重要性を最初に指摘したのは、グーグルのGNoMEであると思われる。GNoMEについては、こちらを参照。
2⃣ 基底状態
FlowLLMは、一致率も高い。ここで言う一致率とは、生成された構造が緩和された基底状態にどれだけ近いかを表す指標である。FlowLLMは、CHGNet🐾40で緩和された構造と比較して94.9%の一致率を達成し、FlowMMの74.3%を大幅に上回る。FlowLLMは、このように緩和状態に近い構造を生成することで、事後最適化に必要な高価なDFT計算を削減することが可能となる。そして、この効率性ゆえに、低い計算予算内で化学空間のより大きな部分を探索することが可能になる、と主張する。
🐾40 Crystal Hamiltonian Graph Neural Network。ポテンシャルエネルギー面をモデル化するGNNベースの機械学習原子間ポテンシャル。Materials Project Trajectory Datasetのエネルギー、磁気モーメント等で事前学習されている。磁気モーメントを明示的に組み込むことで、CHGNetは電子の軌道占有を学習し、正確に表現できるようになり、原子と電子の両方の自由度を記述する能力が向上する。
3⃣ 計算効率
性能の改善は計算コストの削減に直接つながる。FlowLLMはFlowMMの191.98ステップと比較して、わずか37.97回の事前緩和ステップしか必要としない。さらに、効率の向上は、積分プロセス自体にも及ぶ。FlowLLMは、RFMモデルが収束するために必要な積分ステップ数が大幅に少なく、他のフローベースモデルが通常必要とする数百または数千ステップと比較して、わずか50ステップで高い構造的妥当性を達成する。
【5】考察
(1) MIは、なぜ停滞しているのか?
0⃣ 前口上
21世紀創薬の三種の神器と言われた🐾42技術は、「コンビナトリアル・ケミストリー(コンビケム)、ゲノミクス、ハイスループットスクリーニング(HTS)」である。コンビケムは、1980~90年代に開発され、爆発的に流行した。それまで新規化合物を合成は、102個/年/人が限界だった。コンビケムは、それを103~105個/年/人まで拡張した。つまり、最大で1,000倍も増やしたことになる。ただし、コンビケムで合成される化合物は、そのほとんどが、水に溶けなかった🐾43。当時は薬と言えば経口薬の時代。つまり、水溶性がなければお話にならない時代である。そこで、薬らしさ(drug-likeness)という概念が生まれた🐾44。
🐾42 出所:https://labchem-wako.fujifilm.com/jp/journal/docs/org08.pdf
🐾43 藤沢薬品工業(現アステラス製薬)の研究者に、「水溶性がなくて本当に困っている」という話を直接聞いた。
🐾44 米製薬大手ファイザーに在籍していたクリストファー・リピンスキー博士が提唱したRule of Fiveに表象されている。
1⃣ 閑話休題
米グーグルが開発した生成モデルGNoMEに対して、「GNoMEが安定化合物として予測した提案の多く(8割程度)は、現実世界では無秩序な構造になる」等と批判する記事🐾45がnatureに掲載された(25年10月1日付)。つまり0⃣と同じで、現場で本当に欲しいモノが提案出来ていないこと(=失望)に尽きるのだろう。逆設計の概念(というか要求)及び、自律ラボまでを包含するエンドツーエンド・システムの登場は、その失望を反映していると思われる。もちろん、逆設計は課題山積み(☞【2】(1)及び(2))であるし、自律ラボも同様である。自律ラボの場合、LLMの科学的推論能力向上が、本質的に重要と思われる。
🐾45 https://www.nature.com/articles/d41586-025-03147-9
2⃣ 科学的推論について
例えば、CURIEというベンチマークがある[*A-43]。これは、米グーグル他の研究者によって、「LLMの科学的推論能力と長文の文脈理解能力を測定する」ために開発されたベンチマークである。「材料科学、凝縮系物理(物性物理)、量子コンピューティング、地理空間分析、生物多様性、タンパク質科学」の6分野における10個のかなり高度タスクに対して、検証を行っている。結果は、およそ2/3がタスク失敗であった。
その一方で、面白い研究結果もある。米セールス・フォースと米イリノイ大学アーバナ・シャンペーン校は、「LLMの数学的推論において高いパフォーマンスを達成するために、複雑な強化学習アルゴリズムは、必ずしも必要ではない」という結果を提示した[*A-44]。LLMの科学的推論能力が飛躍的に向上するキッカケになるかもしれない。
【尾注】
*A-18 https://news.mit.edu/2026/accelerating-science-ai-and-simulations-rafael-gomez-bombarelli-0212
*A-19 https://www.jst.go.jp/crds/sympo/20220325/pdf/20220405_01.pdf
*A-20 AI-Accelerated Materials Discovery in 2026: How Generative Models, Graph Neural Networks, and Autonomous Labs Are Transforming R&D、https://www.cypris.ai/insights/ai-accelerated-materials-discovery-in-2025-how-generative-models-graph-neural-networks-and-autonomous-labs-are-transforming-r-d
*A-21 https://www.smbc.co.jp/hojin/report/investigationlecture/resources/pdf/3_00_CRSDReport090.pdf
*A-22 Xiao-Qi Han et al.、AI-Driven Inverse Design of Materials: Past, Present, and Future、https://iopscience.iop.org/article/10.1088/0256-307X/42/2/027403/pdf
*A-23 Shuo Tao & Li Zhu、EOSnet: Embedded Overlap Structures for Graph Neural Networks in Predicting Material Properties、https://pubs.acs.org/doi/pdf/10.1021/acs.jpclett.4c03179?ref=article_openPDF
*A-24 Zijian Du et al.、CTGNN: Crystal Transformer Graph Neural Network for Crystal Material Property Prediction、https://arxiv.org/pdf/2405.11502
*A-25 Yasen Cui et al.、SA-GNN: Prediction of material properties using graph neural network based on multi-head self-attention optimization 、https://pubs.aip.org/aip/adv/article-pdf/doi/10.1063/5.0186891/19966905/055033_1_5.0186891.pdf
*A-26 Longlong Li et al.、Kolmogorov–Arnold graph neural networks for molecular property prediction、https://www.nature.com/articles/s42256-025-01087-7.pdf
*A-27 新田 仁、マテリアルズインフォマティクスの動向と今後の展望、https://www.mizuho-rt.co.jp/publication/2021/articles_0062.html
*A-28 逆設計: 目的の二次元構造を再現するパッチ粒子系を開発、https://www.wpi-aimr.tohoku.ac.jp/jp/aimresearch/highlight/2023/20230828_001649.html
*A-29 He Li et al.、Deep-Learning Density Functional Theory Hamiltonian for Efficient ab initio Electronic-Structure Calculation、https://www.nature.com/articles/s43588-022-00265-6.pdf
*A-30 Yang Zhong et al.、Transferable equivariant graph neural networks for the Hamiltonians of molecules and solids、https://www.nature.com/articles/s41524-023-01130-4.pdf
*A-31 Dilshod Nematov et al.、The Bright Future of Materials Science with AI: Self-Driving Laboratories and Closed-Loop Discovery、https://article.innovationforever.com/JMN/20250136.html
*A-32 Amanda A. Volk et al.、AlphaFlow: autonomous discovery and optimization of multi-step chemistry using a selfdriven fluidic lab guided by reinforcement learning、https://www.nature.com/articles/s41467-023-37139-y.pdf
*A-33 Jinge Xu et al.、Autonomous multi-robot synthesis and optimization of metal halide perovskite nanocrystals、https://www.nature.com/articles/s41467-025-63209-4.pdf
*A-34 Fan Gao et al.、A chemical autonomous robotic platform for end-to-end synthesis of nanoparticles、https://www.nature.com/articles/s41467-025-62994-2.pdf
*A-35 Florian Häse et al.、Olympus: a benchmarking framework for noisy optimization and experiment planning、https://arxiv.org/pdf/2010.04153
*A-36 Andy S. Anker et al.、Autonomous nanoparticle synthesis by design、https://www.arxiv.org/pdf/2505.13571
*A-37 David Eriksson & Martin Jankowiak、High-Dimensional Bayesian Optimization with Sparse Axis-Aligned Subspaces、https://arxiv.org/pdf/2103.00349
*A-38 Anuroop Sriram et al.、FlowLLM: Flow Matching for Material Generation with Large Language Models as Base Distributions、https://arxiv.org/pdf/2410.23405
*A-39 Nate Gruver et al.、FINE-TUNED LANGUAGE MODELS GENERATE STABLE INORGANIC MATERIALS AS TEXT、https://arxiv.org/pdf/2402.04379
*A-40 Nathan J. Szymanski et al.、An autonomous laboratory for the accelerated synthesis of inorganic materials、https://www.nature.com/articles/s41586-023-06734-w.pdf
*A-41 Mouyang Cheng et al.、Enhancing Materials Discovery with Valence Constrained Design in Generative Modeling、https://arxiv.org/pdf/2507.19799
*A-42 Yun Hao et al.、Inverse Materials Design by Large Language Model-Assisted Generative Framework、https://arxiv.org/pdf/2502.18127
*A-43 Hao Cui et al.、CURIE: EVALUATING LLMS ON MULTITASK SCIENTIFIC LONG CONTEXT UNDERSTANDING AND REASONING、https://www.arxiv.org/pdf/2503.13517
*A-44 Wei Xiong et al.、A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce、https://arxiv.org/pdf/2504.11343
*A-45 Isomorphic Labs Team、Accurate Predictions of Novel Biomolecular Interactions with IsoDDE、https://storage.googleapis.com/isomorphiclabs-website-public-artifacts/isodde_technical_report.pdf
*A-46 Yuya Tahara-Arai et al.、GEMS: a deterministic finite automaton framework for adaptive laboratory automation、https://pubs.rsc.org/en/content/articlelanding/2026/dd/d5dd00409h