研究課題/領域番号 |
18J23034
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
数理情報学
|
研究機関 | 東京大学 |
研究代表者 |
黒木 祐子 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2018-04-25 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
2,200千円 (直接経費: 2,200千円)
2020年度: 700千円 (直接経費: 700千円)
2019年度: 700千円 (直接経費: 700千円)
2018年度: 800千円 (直接経費: 800千円)
|
キーワード | 密グラフ抽出 / グラフマイニング / 不完全情報学習 / 情報理論 / 強化学習 / 多腕バンディット問題 / 近似アルゴリズム / 組合せバンディット / 最適腕識別問題 / ネットワーク設計 / 組合せ最適化 |
研究実績の概要 |
今年度は機械学習の重要な分野の一つである逐次的意思決定問題に取り組んだ. 具体的には「限られた観測に基づく密グラフ抽出に対するバンディットアルゴリズム」に関する研究を行なった:実ネットワーク上の密な部分構造の抽出は, グラフマイニングにおける重要な操作の一つである.本研究では,(重みが未知の)枝集合からの限られた観測に基づく密グラフ抽出を考え, バンディット問題としての定式化と二つのアルゴリズムを提案した. この研究成果は機械学習の難関国際会議であるICML2020に採択されている. また上記の研究をさらに発展させる一般的な枠組みを提案する研究として, 報酬関数がリプシッツ連続性を満たす任意の場合に対するアルゴリズムの提案と理論解析を与えた. この結果は人工知能の難関国際会議であるAAAI2021に採択された. さらに, 選択した行動を構成する各要素( e.g. ネットワークにおける枝)が観測として得られる場合に対しては, 情報論的下界と一致する最適なアルゴリズムを提案した. また, 非線形関数の特殊ケースとして,選択した行動を構成する要素のうち最も報酬が小さいもので全体の報酬が定義されるbottleneck rewardという重要な設定に対してはよりタイトな理論保証を持つアルゴリズムを設計した.これらの結果をまとめた論文は機械学習の国際会議に投稿中である. 今年度は本課題のまとめとしても,国際的にインパクトのある研究成果を出すことができた. 本研究の総括を基に, さらなる実社会への汎用性の高いアルゴリズム設計とその理論解析を目指す予定である.
|
現在までの達成度 (段落) |
令和2年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和2年度が最終年度であるため、記入しない。
|