研究領域 | 「学習物理学」の創成-機械学習と物理学の融合新領域による基礎物理学の変革 |
研究課題/領域番号 |
23H04527
|
研究種目 |
学術変革領域研究(A)
|
配分区分 | 補助金 |
審査区分 |
学術変革領域研究区分(Ⅱ)
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
道下 佳寛 国立研究開発法人理化学研究所, 創発物性科学研究センター, 客員研究員 (90969411)
|
研究期間 (年度) |
2023-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 機械学習 / 強化学習 / 周期駆動系 / machine learning / 強相関系 / Floquet systems / cavity systems |
研究開始時の研究の概要 |
物理学における理論研究は簡単に言ってしまえば、既存の式の組み合わせから非自明な意味のある式を導出し、それを自然現象に適用することである。その式の組み合わせを、有限の手番を与えられた時の"手筋"だと思えば、物理学の理論研究も、将棋と囲碁のようなゲームとして捉える事が出来る。(ただし物理学の方が"手筋"が圧倒的に広いので、物理学者の経験と直感,物理的な要請から手筋を狭める必要がある) 本研究では、AlphaGoなどで採用されている強化学習の手法を理論物理学に適用し、新たな理論解析の枠組みを作る事を目指す。
|
研究実績の概要 |
Alpha Zeroのアルゴリズムを用いた記号回帰を用いて、物理における理論解析手法を導出するためのフレームワークを提案した。これまでの記号回帰を物理に用いる研究においては、未知の非線形ダイナミクスの方程式を同定することを目的としたものが全てであったが、本研究では、「ダイナミクスの方程式は既知として、ダイナミクスを理論的に解析しやすくなるような基底を探索する」ことを目的とした。 方程式の導出を「1ターンに一つ、与えられた記号を式に追加していって有用な方程式を作るゲーム」としてみなし、方程式の有用さを与える指標を定義すれば、方程式の探索は"ゲームの最善戦略の探索"の問題となるので、強化学習手法で"解く"ことが出来る。 既存の研究では、遺伝的アルゴリズムやモンテカルロ木探索、回帰型ニューラルネットワークを用いたものがあったが、Alpha Zeroはそれらの苦手とする部分を克服している。 本研究では特に周期駆動系に着目し、「理論的な解析の利便性の指標」として「時間依存ユニタリ変換後のハミルトニアンの時間依存性の小ささ」を設定することで、Alpha ZeroがFloquet-Magnus展開を”導出”できることを示した。これは記号回帰により導出しているので、文字通り表式を導出している。 またその他の強化学習手法である、epsilon-greedy法やActor-Critic法(PPO)と比較し、Alpha Zeroによるアルゴリズムが良い性能を示すこともわかった。(例えば2次までのFloquet-Magnus展開については他の手法でも導出できるが、3次についてはAlpha Zeroのみが導出出来ている。)
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予定通り、一番簡単な問題設定・ベンチマークととして、周期駆動系の場合について解析し、論文としてまとめることができた。
|
今後の研究の推進方策 |
周期駆動系はある種古典光による駆動の解析であった。 今後はCavity系といった量子光により駆動された系についても今回のフレームワークを適用し、既知の有用な基底もしくは今まで知られていなかった有用な基底が発見できるかを確認する予定である。
また時間が許せば、強相関超伝導におけるBCS基底を超えるような有用な基底の探索にも取り組んでいきたい。
|