2020 Fiscal Year Research-status Report

Modelling of human decision making using inverse optimization

Research Project

Project/Area Number	19K04455
Research Institution	Kyushu University
Principal Investigator	村田純一九州大学, システム情報科学研究院, 教授 (60190914)
Project Period (FY)	2019-04-01 – 2022-03-31
Keywords	人のモデル / 人の判断 / 社会サービス / 個人化 / 逆強化学習 / 多目的最適化
Outline of Annual Research Achievements	本研究課題で解決する主要課題は逆最適化問題が一意の解を持たないことである．この解決を行うための基本的な考え方は，得るべき解の表現自由度と利用可能なデータが持つ情報の量の間の適切なバランスをとることである．この考えに沿って２つのアプローチについて研究を行い以下の成果を得た．逆最適化の一種である逆強化学習では，人が良しあしを判断する基準となる報酬を，人の行動データを基に求める．この報酬を表す関数に含まれるパラメータ数が利用可能データ量に比べて過大であると一意解が得られない．第１のアプローチとして，2019年度の本研究の中で見出したパラメータ数の評価尺度を用い，所与のデータに応じて適切なパラメータ数を自動的に決定する方法を考案し，シミュレーションによってその効果を確認した．第２のアプローチでは，通常の逆強化学習では人による最適行動データだけを利用するのに対し，最適から外れる行動のデータも活用することによって，利用データを増やし，ここから報酬関数の関数形を規定する情報を得て一意解の取得に活用する．この方法の具体化を行い，シミュレーションによってその有効性を確認した．以上に加えて，人の意思決定に複数の評価基準が用いられる多目的最適化問題について予備的研究を実施した．判断基準である目的関数が複数存在する場合，各目的関数の重要性の差異を考慮して意思決定を行う．この重要性を表す重み係数を決定する方法として，データに基づく推定と，人の判断に基づく決定の２種類の方法を適切に混合し，合理的な重み係数を得る方法を開発し，電力デマンドレスポンスの評価に関するサンプルデータに適用してその有効性を確認した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 単一の判断基準を対象とする2019年度の成果を発展させることができた．また，2021年度に実施を計画していた判断基準が多数存在する多目的最適化問題についての予備的な成果を得ることができた．新型コロナウイルス感染症予防のため，人による実験の実施が困難となったが，コンピュータシミュレーションによる研究実施に切り替え，研究を進捗させることができた．
Strategy for Future Research Activity	2020年度までに得られた成果を発展させる．多目的最適化問題の取扱いについて研究を進展させるほか，これまでの研究によって得た理論面での研究成果を実際のデータに適用する際に予想されるデータの不確実性などの課題の解決の研究を進める．申請時にはドライビングシミュレータを用いた人による自動車運転挙動データ取得を行い，これを活用する予定であったが，新型コロナウイルス感染症対策のため，人による実験を取りやめ，公開されているオープンデータとシミュレーションを活用することとする
Causes of Carryover	新型コロナウイルス感染症の影響のため学会がオンライン開催となり旅費支出が不要となったことと，同感染症防止のために人による実験をとりやめ謝金支出がなくなったことにより，次年度使用額が生じた．次年度は実験ではなくオープンデータを活用することとし，次年度使用額を次年度助成金と合わせてデータ整理のアルバイト謝金に充てる．

Research Products
(3 results)

All 2020

All Journal Article (1 results) (of which Open Access: 1 results) Presentation (2 results)

[Journal Article] 目的関数の推定：循環・螺旋型システムズアプローチに資するモデリングと意思決定過程把握2020
- Author(s)
  村田純一, 船木亮平
- Journal Title
  
  計測と制御
  
  Volume: 59 Pages: 918-921
- DOI
  10.11499/sicejl.59.918
- Open Access
[Presentation] 行動頻度から推定した状態価値の相対的関係を活用した逆強化学習2020
- Author(s)
  甲斐田幸希, 船木亮平, 村田純一
- Organizer
  計測自動制御学会システム・情報部門学術講演会 2020
[Presentation] Evaluation Model for Demand Response Based on Integrated ANP-Entropy Method2020
- Author(s)
  Chen Zhang, Ryohei Funaki, Junichi Murata
- Organizer
  計測自動制御学会システム・情報部門学術講演会 2020

2020 Fiscal Year Research-status Report

Modelling of human decision making using inverse optimization

Principal Investigator

村田 純一 九州大学, システム情報科学研究院, 教授 (60190914)

Current Status of Research Progress

Reason

Research Products

[Journal Article] 目的関数の推定：循環・螺旋型システムズアプローチに資するモデリングと意思決定過程把握2020

Author(s)

Journal Title

DOI

[Presentation] 行動頻度から推定した状態価値の相対的関係を活用した逆強化学習2020

Author(s)

Organizer

[Presentation] Evaluation Model for Demand Response Based on Integrated ANP-Entropy Method2020

Author(s)

Organizer

村田純一九州大学, システム情報科学研究院, 教授 (60190914)