• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

逆最適化を用いた人の意思決定のモデル構築

研究課題

研究課題/領域番号 19K04455
研究機関九州大学

研究代表者

村田 純一  九州大学, システム情報科学研究院, 教授 (60190914)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワード人のモデル / 人の判断 / 社会サービス / 個人化 / 逆強化学習 / 多目的最適化
研究実績の概要

本研究課題で解決する主要課題は逆最適化問題が一意の解を持たないことである.この解決を行うための基本的な考え方は,得るべき解の表現自由度と利用可能なデータが持つ情報の量の間の適切なバランスをとることである.この考えに沿って2つのアプローチについて研究を行い以下の成果を得た.
逆最適化の一種である逆強化学習では,人が良しあしを判断する基準となる報酬を,人の行動データを基に求める.この報酬を表す関数に含まれるパラメータ数が利用可能データ量に比べて過大であると一意解が得られない.第1のアプローチとして,2019年度の本研究の中で見出したパラメータ数の評価尺度を用い,所与のデータに応じて適切なパラメータ数を自動的に決定する方法を考案し,シミュレーションによってその効果を確認した.第2のアプローチでは,通常の逆強化学習では人による最適行動データだけを利用するのに対し,最適から外れる行動のデータも活用することによって,利用データを増やし,ここから報酬関数の関数形を規定する情報を得て一意解の取得に活用する.この方法の具体化を行い,シミュレーションによってその有効性を確認した.
以上に加えて,人の意思決定に複数の評価基準が用いられる多目的最適化問題について予備的研究を実施した.判断基準である目的関数が複数存在する場合,各目的関数の重要性の差異を考慮して意思決定を行う.この重要性を表す重み係数を決定する方法として,データに基づく推定と,人の判断に基づく決定の2種類の方法を適切に混合し,合理的な重み係数を得る方法を開発し,電力デマンドレスポンスの評価に関するサンプルデータに適用してその有効性を確認した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

単一の判断基準を対象とする2019年度の成果を発展させることができた.また,2021年度に実施を計画していた判断基準が多数存在する多目的最適化問題についての予備的な成果を得ることができた.新型コロナウイルス感染症予防のため,人による実験の実施が困難となったが,コンピュータシミュレーションによる研究実施に切り替え,研究を進捗させることができた.

今後の研究の推進方策

2020年度までに得られた成果を発展させる.多目的最適化問題の取扱いについて研究を進展させるほか,これまでの研究によって得た理論面での研究成果を実際のデータに適用する際に予想されるデータの不確実性などの課題の解決の研究を進める.申請時にはドライビングシミュレータを用いた人による自動車運転挙動データ取得を行い,これを活用する予定であったが,新型コロナウイルス感染症対策のため,人による実験を取りやめ,公開されているオープンデータとシミュレーションを活用することとする

次年度使用額が生じた理由

新型コロナウイルス感染症の影響のため学会がオンライン開催となり旅費支出が不要となったことと,同感染症防止のために人による実験をとりやめ謝金支出がなくなったことにより,次年度使用額が生じた.次年度は実験ではなくオープンデータを活用することとし,次年度使用額を次年度助成金と合わせてデータ整理のアルバイト謝金に充てる.

  • 研究成果

    (3件)

すべて 2020

すべて 雑誌論文 (1件) (うちオープンアクセス 1件) 学会発表 (2件)

  • [雑誌論文] 目的関数の推定:循環・螺旋型システムズアプローチに資するモデリングと意思決定過程把握2020

    • 著者名/発表者名
      村田 純一, 船木 亮平
    • 雑誌名

      計測と制御

      巻: 59 ページ: 918-921

    • DOI

      10.11499/sicejl.59.918

    • オープンアクセス
  • [学会発表] 行動頻度から推定した状態価値の相対的関係を活用した逆強化学習2020

    • 著者名/発表者名
      甲斐田 幸希, 船木 亮平, 村田 純一
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会 2020
  • [学会発表] Evaluation Model for Demand Response Based on Integrated ANP-Entropy Method2020

    • 著者名/発表者名
      Chen Zhang, Ryohei Funaki, Junichi Murata
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会 2020

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi