2018 年度実施状況報告書

情報論的手法に基づく知識探索アルゴリズムの構築

研究課題

研究課題/領域番号	18K17998
研究機関	東京大学
研究代表者	本多淳也東京大学, 大学院新領域創成科学研究科, 講師 (10712391)
研究期間 (年度)	2018-04-01 – 2021-03-31
キーワード	機械学習 / 情報理論
研究実績の概要	当年度の研究では，限られた試行回数で探索すべき候補を適切に選択する問題である多腕バンディット問題において情報論的手法に基づいた効率的なアルゴリズムの開発を行った．多腕バンディット問題のうち累積報酬の最大化を目指さない純粋探索問題の枠組みでは最適腕識別が代表的な設定として知られているが，この問題では探索回数の下限すら非現実的な大きい値となることが多く，必ずしも実用に適さない．そこで本研究では，真に報酬期待値最適な候補を選ぶのではなく，報酬期待値が事前に定めたしきい値を上回る候補を可能な限り早く発見する問題を良腕識別問題として新たに構成した．さらに，この問題が純粋探索問題に属するにも関わらず累積報酬最大化と類似の構造をもつことを明らかにし，その性質を利用することで探索回数についての情報論的理論限界およびそれを達成するアルゴリズムを構成した．この結果は機械学習のトップ論文誌であるMachine Learning誌に採録された．さらに，これらのバンディットアルゴリズムの医療等への応用を考えた場合，各時刻で選択する候補は薬や治療法といったものが対応することになるが，それらの場面ではその報酬が量的でなく「完治」「効果あり」「効果なし」といったように質的にのみ観測される場合が多い．そこで，こういった質的な報酬から各候補の良し悪しを定量化する方法を社会学における手法に基づいて構築し，情報論的限界を達成するアルゴリズムを構成した．さらに，多くの場面で経験的に性能がよいことが知られているトンプソンサンプリングとよばれるアルゴリズムが本設定では場合によっては非常に性能が悪くなることを理論的に示し，本問題特有の性質を用いる重要性を示唆した．この結果は機械学習のトップ会議であるAAAI2019に採録された．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由当年度の研究では良腕識別という試行回数が非常に限られた場面に適した場合における効率的な枠組みを構築できただけでなく，定性的な観測を扱うアルゴリズムの構成という予期せぬ結果も得られており，この部分では予想を上回る進捗状況となった．一方，これらの手法では従来手法に比べて性能の上下界のギャップを大幅に縮めているものの，未だそのギャップは漸近論が成り立たない場面では比較的大きく，なお改善の余地がある状況である．
今後の研究の推進方策	これまでの研究状況を踏まえ，今後の研究ではより現実的な設定に適したアルゴリズムの開発および理論限界の構成を行う．本研究のこれまでの結果および既存研究から，理論限界に近い性能をもつアルゴリズムでは計算量的に難しい最適化問題が現れることが多いことが分かってきている．特に，これまで知られてきた漸近最適アルゴリズムの多くは理論限界の推定値を明示的に計算するという部分をサブルーチンとしており，このような種類のアルゴリズムでは理論限界自体が最適化問題として表される場合にはその時点で非現実的な計算量となってしまう．それに対して，トンプソンサンプリングといった乱択手法を用いるアルゴリズムでは最適化問題によってのみ表されるような理論限界を最適化計算なしに達成できる場合があることが知られているが，一方で単純なトンプソンサンプリングは理論限界を達成しない設定が数多くあることも分かってきている．そこで次年度の研究では，最適化問題を明示的に解くのを避けつつかつ広範な問題に適用可能なアルゴリズムの開発を乱択手法の性質を適切に抽出することで行う．

研究成果
(5件)

すべて 2019 2018

すべて雑誌論文 (5件) (うち国際共著 1件、査読あり 5件、オープンアクセス 3件)

[雑誌論文] Unsupervised Domain Adaptation Based on Source-guided Discrepancy2019
- 著者名/発表者名
  Seiichi Kuroki, Nontawat Charoenphakdee, Han Bao, Junya Honda, Issei Sato, Masashi Sugiyama
- 雑誌名
  
  The 23rd AAAI Conference on Artificial Intelligence (AAAI2019)
  
  巻: - ページ: -
- 査読あり / オープンアクセス
[雑誌論文] Dueling Bandits with Qualitative Feedback2019
- 著者名/発表者名
  Liyuan Xu, Junya Honda, Masashi Sugiyama
- 雑誌名
  
  The 23rd AAAI Conference on Artificial Intelligence (AAAI2019)
  
  巻: - ページ: -
- 査読あり / オープンアクセス
[雑誌論文] Good Arm Identification via Bandit Feedback2019
- 著者名/発表者名
  Hideaki Kano, Junya Honda, Kentaro Sakamaki, Kentaro Matsuura, Atsuyoshi Nakamura, Masashi Sugiyama
- 雑誌名
  
  Machine Learning
  
  巻: - ページ: 1-25
- DOI
  https://doi.org/10.1007/s10994-019-05784-4
- 査読あり
[雑誌論文] Exact Asymptotics of Random Coding Error Probability for General Memoryless Channels2019
- 著者名/発表者名
  Junya Honda
- 雑誌名
  
  2018 IEEE International Symposium on Information Theory (ISIT2018)
  
  巻: - ページ: 1844-1848
- 査読あり
[雑誌論文] Nonconvex Optimization for Regression with Fairness Constraints2018
- 著者名/発表者名
  Junpei Komiyama, Akiko Takeda, Junya Honda, Hajime Shimao
- 雑誌名
  
  The 35th International Conference on Machine Learning (ICML2018)
  
  巻: - ページ: 2737-2746
- 査読あり / オープンアクセス / 国際共著

2018 年度 実施状況報告書

情報論的手法に基づく知識探索アルゴリズムの構築

研究代表者

本多 淳也 東京大学, 大学院新領域創成科学研究科, 講師 (10712391)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Unsupervised Domain Adaptation Based on Source-guided Discrepancy2019

著者名/発表者名

雑誌名

[雑誌論文] Dueling Bandits with Qualitative Feedback2019

著者名/発表者名

雑誌名

[雑誌論文] Good Arm Identification via Bandit Feedback2019

著者名/発表者名

雑誌名

DOI

[雑誌論文] Exact Asymptotics of Random Coding Error Probability for General Memoryless Channels2019

著者名/発表者名

雑誌名

[雑誌論文] Nonconvex Optimization for Regression with Fairness Constraints2018

著者名/発表者名

雑誌名

2018 年度実施状況報告書

本多淳也東京大学, 大学院新領域創成科学研究科, 講師 (10712391)