Publicly Offered Research
Grant-in-Aid for Transformative Research Areas (A)
物理学における理論研究は簡単に言ってしまえば、既存の式の組み合わせから非自明な意味のある式を導出し、それを自然現象に適用することである。その式の組み合わせを、有限の手番を与えられた時の"手筋"だと思えば、物理学の理論研究も、将棋と囲碁のようなゲームとして捉える事が出来る。(ただし物理学の方が"手筋"が圧倒的に広いので、物理学者の経験と直感,物理的な要請から手筋を狭める必要がある)本研究では、AlphaGoなどで採用されている強化学習の手法を理論物理学に適用し、新たな理論解析の枠組みを作る事を目指す。
Alpha Zeroのアルゴリズムを用いた記号回帰を用いて、物理における理論解析手法を導出するためのフレームワークを提案した。これまでの記号回帰を物理に用いる研究においては、未知の非線形ダイナミクスの方程式を同定することを目的としたものが全てであったが、本研究では、「ダイナミクスの方程式は既知として、ダイナミクスを理論的に解析しやすくなるような基底を探索する」ことを目的とした。方程式の導出を「1ターンに一つ、与えられた記号を式に追加していって有用な方程式を作るゲーム」としてみなし、方程式の有用さを与える指標を定義すれば、方程式の探索は"ゲームの最善戦略の探索"の問題となるので、強化学習手法で"解く"ことが出来る。既存の研究では、遺伝的アルゴリズムやモンテカルロ木探索、回帰型ニューラルネットワークを用いたものがあったが、Alpha Zeroはそれらの苦手とする部分を克服している。本研究では特に周期駆動系に着目し、「理論的な解析の利便性の指標」として「時間依存ユニタリ変換後のハミルトニアンの時間依存性の小ささ」を設定することで、Alpha ZeroがFloquet-Magnus展開を”導出”できることを示した。これは記号回帰により導出しているので、文字通り表式を導出している。またその他の強化学習手法である、epsilon-greedy法やActor-Critic法(PPO)と比較し、Alpha Zeroによるアルゴリズムが良い性能を示すこともわかった。(例えば2次までのFloquet-Magnus展開については他の手法でも導出できるが、3次についてはAlpha Zeroのみが導出出来ている。)
2: Research has progressed on the whole more than it was originally planned.
予定通り、一番簡単な問題設定・ベンチマークととして、周期駆動系の場合について解析し、論文としてまとめることができた。
周期駆動系はある種古典光による駆動の解析であった。今後はCavity系といった量子光により駆動された系についても今回のフレームワークを適用し、既知の有用な基底もしくは今まで知られていなかった有用な基底が発見できるかを確認する予定である。また時間が許せば、強相関超伝導におけるBCS基底を超えるような有用な基底の探索にも取り組んでいきたい。
All 2024 2023
All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results) (of which Int'l Joint Research: 1 results, Invited: 1 results)
Journal of the Physical Society of Japan
Volume: -