研究課題/領域番号 |
23KJ0384
|
研究種目 |
特別研究員奨励費
|
配分区分 | 基金 |
応募区分 | 国内 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 東京大学 |
研究代表者 |
山上 智輝 東京大学, 情報理工学系研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2023-04-25 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
1,800千円 (直接経費: 1,800千円)
2024年度: 900千円 (直接経費: 900千円)
2023年度: 900千円 (直接経費: 900千円)
|
キーワード | 量子ウォーク / 多腕バンディット問題 / 意思決定 |
研究開始時の研究の概要 |
バンディットアルゴリズムを用いた意思決定問題は,現実世界における多岐にわかる応用問題の基礎となっていることから,近年活発に研究が行われている.一方.量子の性質を生かして諸問題の解決を目指す量子アルゴリズムの研究の発展も目覚ましく,特にその数理的基盤である量子ウォークの数学的解析など,その関心は学際的な規模となっている.本研究は,量子ウォークの数理的特性を活用することにより,高い探索性と活用性を両立する「量子ウォークバンディットアルゴリズム」を世界に先駆けて構築する.
|
研究実績の概要 |
本課題は,「研究A:量子ウォークバンディットに向けた要素理論の整備」「研究B:量子ウォークによる意思決定の加速メカニズム」「研究C:量子ウォークバンディットアルゴリズムの構築」の3本柱により構成されているが,今年度は特に研究Cにおいて目覚ましい業績が,大きく分けて2つ成された. 一つ目に,量子ウォークの確率分布の特徴を用いた多腕バンディットにおける報酬最大化方策の提案を行った.この方策では,量子ウォークの確率分布が同時に有し得る「線形的拡がり」と「局在化」という対照的な2つの性質を,強化学習においてトレードオフの関係にある「探索」と「活用」という2つの操作と関連づけることにより,効率的な意思決定を実現していることを数値シミュレーションを通して示されたほか,パラメータ依存性など詳細な考察が行われた.また,本年度期間中には本研究に関する公刊論文がEntropy誌より発表され,関連分野に大きな影響を与える最先端研究に与えられるFeature Paperの称号を受けた. 二つ目に,量子ウォークの空間探索性を用いた,空間上に配置されたスロットマシン環境における最適腕識別のアルゴリズム (Spatial quantum best-arm identification; SQBAI) を構築した.この研究では,一般のネットワーク(グラフ)構造に対する数学的な枠組みを量子ウォークの空間探索モデルの一般化を与えるSzegedyウォークを用いて構築し,実質的に空間的制約を持たないループ付き完全グラフへの適用を通してその妥当性を実証した.また,空間的制約のある最も簡単な例として完全2部グラフ上のSQBAIを数学的に解析し,計算時間や探索精度の議論を行った.以上の結果を,国内外の学会にて発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
上述のとおり,代表者は「研究C:量子ウォークバンディットアルゴリズムの構築」において2つの成果を挙げたが,特に後者については,問題設定自体が新しく,理論面でも実現に時間がかかると予想されていた研究であり,前述のような数学的な枠組みが本課題期間の1年目で構築できたという点で,この研究柱に関しては期待以上の進捗があったといえる.一方で,当初は課題期間の1年目は「研究B:量子ウォークによる意思決定の加速メカニズム」を中心に研究を行う予定であったが,こちらに関しては想定よりも進捗が遅れている状況にある.研究全体としては,研究Cの進捗に関する大きな障壁を突破できたことは今年度の重要な進展であると判断し,当初の研究とは順序が変わってしまっているものの「おおむね順調に進展している」とした.
|
今後の研究の推進方策 |
まず,1年目に大きく進捗した研究Cの続きとして,SQBAIの研究成果をさらに拡充する.具体的には,より複雑なネットワーク構造やランダムグラフにおけるSQBAIの精度を知ることで,アルゴリズムとしてのSQBAIの実用性を実証すべきである.また,「量子バンディットアルゴリズムの構築」という最終的な目標を鑑みれば,探索だけでなく活用にも対応したアルゴリズムの構築も検討すべきであり,SQBAIを基にその具体的な方法を考えていくことも今後の大きな課題である.これらを検討した上で,SQBAIに関して公刊論文を執筆する予定である. また,1年目にあまり進めることのできなった研究Bに力を入れる.最終目標は題目にあるとおり量子ウォークを用いて意思決定を加速することであるが,まずはより直感的なモデルとして古典ランダムウォークを用いた意思決定の加速メカニズムの記述を行う.具体的には,レーザーカオスにより物理的に実装された意思決定モデルは高速にバンディット問題を対処することが知られており,これを確率過程モデルを用いて数学的に表現する研究が行われている.まず,この研究をさらに推進することで,物理的に実現されている高速な意思決定の原理をランダムウォークを用いたアルゴリズムに変換する.そして,得られたランダムウォークに対応する量子ウォークを導入することで,量子ウォークによる高速な意思決定モデルの検討に入っていく.このランダムウォークから量子ウォークの転換を正確に行なっていくために,確率論などを専門とする数理科学系の研究者と多く議論し,数学的に整理されたモデルを構築したい. また,今年度は本課題の最終年度にあたるので,課題期間前の進捗が大きかった研究Aも含めて各研究柱間の関係を深め,「量子ウォークバンディットアルゴリズム」の構築を目指していく.
|