2020 Fiscal Year Research-status Report
Modelling of human decision making using inverse optimization
Project/Area Number |
19K04455
|
Research Institution | Kyushu University |
Principal Investigator |
村田 純一 九州大学, システム情報科学研究院, 教授 (60190914)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 人のモデル / 人の判断 / 社会サービス / 個人化 / 逆強化学習 / 多目的最適化 |
Outline of Annual Research Achievements |
本研究課題で解決する主要課題は逆最適化問題が一意の解を持たないことである.この解決を行うための基本的な考え方は,得るべき解の表現自由度と利用可能なデータが持つ情報の量の間の適切なバランスをとることである.この考えに沿って2つのアプローチについて研究を行い以下の成果を得た. 逆最適化の一種である逆強化学習では,人が良しあしを判断する基準となる報酬を,人の行動データを基に求める.この報酬を表す関数に含まれるパラメータ数が利用可能データ量に比べて過大であると一意解が得られない.第1のアプローチとして,2019年度の本研究の中で見出したパラメータ数の評価尺度を用い,所与のデータに応じて適切なパラメータ数を自動的に決定する方法を考案し,シミュレーションによってその効果を確認した.第2のアプローチでは,通常の逆強化学習では人による最適行動データだけを利用するのに対し,最適から外れる行動のデータも活用することによって,利用データを増やし,ここから報酬関数の関数形を規定する情報を得て一意解の取得に活用する.この方法の具体化を行い,シミュレーションによってその有効性を確認した. 以上に加えて,人の意思決定に複数の評価基準が用いられる多目的最適化問題について予備的研究を実施した.判断基準である目的関数が複数存在する場合,各目的関数の重要性の差異を考慮して意思決定を行う.この重要性を表す重み係数を決定する方法として,データに基づく推定と,人の判断に基づく決定の2種類の方法を適切に混合し,合理的な重み係数を得る方法を開発し,電力デマンドレスポンスの評価に関するサンプルデータに適用してその有効性を確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
単一の判断基準を対象とする2019年度の成果を発展させることができた.また,2021年度に実施を計画していた判断基準が多数存在する多目的最適化問題についての予備的な成果を得ることができた.新型コロナウイルス感染症予防のため,人による実験の実施が困難となったが,コンピュータシミュレーションによる研究実施に切り替え,研究を進捗させることができた.
|
Strategy for Future Research Activity |
2020年度までに得られた成果を発展させる.多目的最適化問題の取扱いについて研究を進展させるほか,これまでの研究によって得た理論面での研究成果を実際のデータに適用する際に予想されるデータの不確実性などの課題の解決の研究を進める.申請時にはドライビングシミュレータを用いた人による自動車運転挙動データ取得を行い,これを活用する予定であったが,新型コロナウイルス感染症対策のため,人による実験を取りやめ,公開されているオープンデータとシミュレーションを活用することとする
|
Causes of Carryover |
新型コロナウイルス感染症の影響のため学会がオンライン開催となり旅費支出が不要となったことと,同感染症防止のために人による実験をとりやめ謝金支出がなくなったことにより,次年度使用額が生じた.次年度は実験ではなくオープンデータを活用することとし,次年度使用額を次年度助成金と合わせてデータ整理のアルバイト謝金に充てる.
|
Research Products
(3 results)