Project/Area Number |
23KJ0384
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Multi-year Fund |
Section | 国内 |
Review Section |
Basic Section 61040:Soft computing-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
山上 智輝 東京大学, 情報理工学系研究科, 特別研究員(DC2)
|
Project Period (FY) |
2023-04-25 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥1,800,000 (Direct Cost: ¥1,800,000)
Fiscal Year 2024: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2023: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | 量子ウォーク / 多腕バンディット問題 / 意思決定 |
Outline of Research at the Start |
バンディットアルゴリズムを用いた意思決定問題は,現実世界における多岐にわかる応用問題の基礎となっていることから,近年活発に研究が行われている.一方.量子の性質を生かして諸問題の解決を目指す量子アルゴリズムの研究の発展も目覚ましく,特にその数理的基盤である量子ウォークの数学的解析など,その関心は学際的な規模となっている.本研究は,量子ウォークの数理的特性を活用することにより,高い探索性と活用性を両立する「量子ウォークバンディットアルゴリズム」を世界に先駆けて構築する.
|
Outline of Annual Research Achievements |
本課題は,「研究A:量子ウォークバンディットに向けた要素理論の整備」「研究B:量子ウォークによる意思決定の加速メカニズム」「研究C:量子ウォークバンディットアルゴリズムの構築」の3本柱により構成されているが,今年度は特に研究Cにおいて目覚ましい業績が,大きく分けて2つ成された. 一つ目に,量子ウォークの確率分布の特徴を用いた多腕バンディットにおける報酬最大化方策の提案を行った.この方策では,量子ウォークの確率分布が同時に有し得る「線形的拡がり」と「局在化」という対照的な2つの性質を,強化学習においてトレードオフの関係にある「探索」と「活用」という2つの操作と関連づけることにより,効率的な意思決定を実現していることを数値シミュレーションを通して示されたほか,パラメータ依存性など詳細な考察が行われた.また,本年度期間中には本研究に関する公刊論文がEntropy誌より発表され,関連分野に大きな影響を与える最先端研究に与えられるFeature Paperの称号を受けた. 二つ目に,量子ウォークの空間探索性を用いた,空間上に配置されたスロットマシン環境における最適腕識別のアルゴリズム (Spatial quantum best-arm identification; SQBAI) を構築した.この研究では,一般のネットワーク(グラフ)構造に対する数学的な枠組みを量子ウォークの空間探索モデルの一般化を与えるSzegedyウォークを用いて構築し,実質的に空間的制約を持たないループ付き完全グラフへの適用を通してその妥当性を実証した.また,空間的制約のある最も簡単な例として完全2部グラフ上のSQBAIを数学的に解析し,計算時間や探索精度の議論を行った.以上の結果を,国内外の学会にて発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上述のとおり,代表者は「研究C:量子ウォークバンディットアルゴリズムの構築」において2つの成果を挙げたが,特に後者については,問題設定自体が新しく,理論面でも実現に時間がかかると予想されていた研究であり,前述のような数学的な枠組みが本課題期間の1年目で構築できたという点で,この研究柱に関しては期待以上の進捗があったといえる.一方で,当初は課題期間の1年目は「研究B:量子ウォークによる意思決定の加速メカニズム」を中心に研究を行う予定であったが,こちらに関しては想定よりも進捗が遅れている状況にある.研究全体としては,研究Cの進捗に関する大きな障壁を突破できたことは今年度の重要な進展であると判断し,当初の研究とは順序が変わってしまっているものの「おおむね順調に進展している」とした.
|
Strategy for Future Research Activity |
まず,1年目に大きく進捗した研究Cの続きとして,SQBAIの研究成果をさらに拡充する.具体的には,より複雑なネットワーク構造やランダムグラフにおけるSQBAIの精度を知ることで,アルゴリズムとしてのSQBAIの実用性を実証すべきである.また,「量子バンディットアルゴリズムの構築」という最終的な目標を鑑みれば,探索だけでなく活用にも対応したアルゴリズムの構築も検討すべきであり,SQBAIを基にその具体的な方法を考えていくことも今後の大きな課題である.これらを検討した上で,SQBAIに関して公刊論文を執筆する予定である. また,1年目にあまり進めることのできなった研究Bに力を入れる.最終目標は題目にあるとおり量子ウォークを用いて意思決定を加速することであるが,まずはより直感的なモデルとして古典ランダムウォークを用いた意思決定の加速メカニズムの記述を行う.具体的には,レーザーカオスにより物理的に実装された意思決定モデルは高速にバンディット問題を対処することが知られており,これを確率過程モデルを用いて数学的に表現する研究が行われている.まず,この研究をさらに推進することで,物理的に実現されている高速な意思決定の原理をランダムウォークを用いたアルゴリズムに変換する.そして,得られたランダムウォークに対応する量子ウォークを導入することで,量子ウォークによる高速な意思決定モデルの検討に入っていく.このランダムウォークから量子ウォークの転換を正確に行なっていくために,確率論などを専門とする数理科学系の研究者と多く議論し,数学的に整理されたモデルを構築したい. また,今年度は本課題の最終年度にあたるので,課題期間前の進捗が大きかった研究Aも含めて各研究柱間の関係を深め,「量子ウォークバンディットアルゴリズム」の構築を目指していく.
|