2023 Fiscal Year Research-status Report
量子ウォークによる量子バンディットアルゴリズムの創成
Project/Area Number |
23KJ0384
|
Research Institution | The University of Tokyo |
Principal Investigator |
山上 智輝 東京大学, 情報理工学系研究科, 特別研究員(DC2)
|
Project Period (FY) |
2023-04-25 – 2025-03-31
|
Keywords | 量子ウォーク / 多腕バンディット問題 / 意思決定 |
Outline of Annual Research Achievements |
本課題は,「研究A:量子ウォークバンディットに向けた要素理論の整備」「研究B:量子ウォークによる意思決定の加速メカニズム」「研究C:量子ウォークバンディットアルゴリズムの構築」の3本柱により構成されているが,今年度は特に研究Cにおいて目覚ましい業績が,大きく分けて2つ成された. 一つ目に,量子ウォークの確率分布の特徴を用いた多腕バンディットにおける報酬最大化方策の提案を行った.この方策では,量子ウォークの確率分布が同時に有し得る「線形的拡がり」と「局在化」という対照的な2つの性質を,強化学習においてトレードオフの関係にある「探索」と「活用」という2つの操作と関連づけることにより,効率的な意思決定を実現していることを数値シミュレーションを通して示されたほか,パラメータ依存性など詳細な考察が行われた.また,本年度期間中には本研究に関する公刊論文がEntropy誌より発表され,関連分野に大きな影響を与える最先端研究に与えられるFeature Paperの称号を受けた. 二つ目に,量子ウォークの空間探索性を用いた,空間上に配置されたスロットマシン環境における最適腕識別のアルゴリズム (Spatial quantum best-arm identification; SQBAI) を構築した.この研究では,一般のネットワーク(グラフ)構造に対する数学的な枠組みを量子ウォークの空間探索モデルの一般化を与えるSzegedyウォークを用いて構築し,実質的に空間的制約を持たないループ付き完全グラフへの適用を通してその妥当性を実証した.また,空間的制約のある最も簡単な例として完全2部グラフ上のSQBAIを数学的に解析し,計算時間や探索精度の議論を行った.以上の結果を,国内外の学会にて発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上述のとおり,代表者は「研究C:量子ウォークバンディットアルゴリズムの構築」において2つの成果を挙げたが,特に後者については,問題設定自体が新しく,理論面でも実現に時間がかかると予想されていた研究であり,前述のような数学的な枠組みが本課題期間の1年目で構築できたという点で,この研究柱に関しては期待以上の進捗があったといえる.一方で,当初は課題期間の1年目は「研究B:量子ウォークによる意思決定の加速メカニズム」を中心に研究を行う予定であったが,こちらに関しては想定よりも進捗が遅れている状況にある.研究全体としては,研究Cの進捗に関する大きな障壁を突破できたことは今年度の重要な進展であると判断し,当初の研究とは順序が変わってしまっているものの「おおむね順調に進展している」とした.
|
Strategy for Future Research Activity |
まず,1年目に大きく進捗した研究Cの続きとして,SQBAIの研究成果をさらに拡充する.具体的には,より複雑なネットワーク構造やランダムグラフにおけるSQBAIの精度を知ることで,アルゴリズムとしてのSQBAIの実用性を実証すべきである.また,「量子バンディットアルゴリズムの構築」という最終的な目標を鑑みれば,探索だけでなく活用にも対応したアルゴリズムの構築も検討すべきであり,SQBAIを基にその具体的な方法を考えていくことも今後の大きな課題である.これらを検討した上で,SQBAIに関して公刊論文を執筆する予定である. また,1年目にあまり進めることのできなった研究Bに力を入れる.最終目標は題目にあるとおり量子ウォークを用いて意思決定を加速することであるが,まずはより直感的なモデルとして古典ランダムウォークを用いた意思決定の加速メカニズムの記述を行う.具体的には,レーザーカオスにより物理的に実装された意思決定モデルは高速にバンディット問題を対処することが知られており,これを確率過程モデルを用いて数学的に表現する研究が行われている.まず,この研究をさらに推進することで,物理的に実現されている高速な意思決定の原理をランダムウォークを用いたアルゴリズムに変換する.そして,得られたランダムウォークに対応する量子ウォークを導入することで,量子ウォークによる高速な意思決定モデルの検討に入っていく.このランダムウォークから量子ウォークの転換を正確に行なっていくために,確率論などを専門とする数理科学系の研究者と多く議論し,数学的に整理されたモデルを構築したい. また,今年度は本課題の最終年度にあたるので,課題期間前の進捗が大きかった研究Aも含めて各研究柱間の関係を深め,「量子ウォークバンディットアルゴリズム」の構築を目指していく.
|
Causes of Carryover |
次年度使用額が生じた理由としては,予定されていた国際学会の現地参加がやむを得ない理由で中止になり,予定よりも旅費による支出が発生しなかったことが挙げられる. 今年度は,本課題の3本柱の1つである「研究B:量子ウォークによる意思決定の加速メカニズム」の遂行のために,所属研究機関外の数理科学系の研究者とより密に議論を行う必要があるため,当初の使用計画に旅費を上乗せする形で計画を変更する.
|