研究課題/領域番号 |
19H00763
|
研究機関 | 名古屋大学 |
研究代表者 |
鈴木 達也 名古屋大学, 工学研究科, 教授 (50235967)
|
研究分担者 |
山口 拓真 名古屋大学, 工学研究科, 特任助教 (30745964)
奥田 裕之 名古屋大学, 工学研究科, 助教 (90456690)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 行動モデル / 変数選択 / モデル予測制御 / 判断エントロピー |
研究実績の概要 |
本研究では、①自身の行動による影響を明記した周辺他者の行動モデルの選定、②インタラクションを伴う行動データの観測と行動モデルの機械学習、③行動モデルを用いた予測と実時間での制約付き最適化による行動決定、④実現された知能の検証と評価、の4つの研究課題に取り組む予定であるが、2020年度は特に、以下の②と③に取り組んだ。 ②データに基づいた行動モデルのパラメータや構造の機械学習 本研究では、ハイブリッド系モデルと検定に基づく変数選択手法を融合し、パラメータのみではなくモデルの離散構造(状態数)や連続系の構造(説明変数)をも同定可能な機械学習法(システム同定手法)を開発した。さらにはそれらのオンラインでの実行についても検討し、他者の行動モデルをオンラインでアップデート、分類、蓄積できるような新たな学習法の枠組み構築に取り組んだ。また、データ取得に関しては同時可能稼働な3台の運転シミュレータとHMDを装着した歩行者とが仮想交通環境を共有する統合シミュレータ環境を構築し、これにより、実車では計測が困難なインタラクションを伴う行動の計測を可能とした。 ③行動モデルを用いた予測と実時間での制約付き最適化による行動決定 運転行動への適用を考える場合、100[msec]以内での処理が求められるが、離散変数を多く含むモデルを持つ場合、その実現は容易ではない。そこで本研究では、離散状態遷移にあらかじめ複数の「シナリオ」を用意し、想定したシナリオの範囲内で離散状態遷移と動作の最適化を行う手法を検討し、その有用性をシミュレーションで検証した。また、本研究では、②で述べた「他者が持つ判断のあいまいさ(エントロピー)」を最小化するよう自己の行動を決定することが他者への配慮になるとの着想のもと、評価関数に判断のエントロピーを組み込むことを考え、その有用性をシミュレーションにて検証した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究の進捗に関しては、おおむね順調に進展していると評価している。特にシミュレータの開発には当初の予定以上にエフォートを割いたが、これは歩行者を対象とした実環境での実験の難しさを痛感したためである。実績概要でも述べたように、複数のシミュレータをネットワークを介して連動させることで、リアリティの高いインタラクションデータを安全、かつ大量に収集する準備が整ったと考えている。 また懸念の一つであったモデル予測制御の計算速度についてもシナリオベースアプローチやランダマイズドベースのアプローチの適用によりある程度のめどが立ったと考えている。これらの成果は著名な国際会議で報告済み、あるいは報告予定であり、今後の進展が期待される。 一報、他者とのインタラクションの本質解明に向けた取り組みにもエフォートを割いており、判断のエントロピーが良いインタラクションの一つの指標になることを見出した。判断のエントロピーは判断のあいまいさを定量化した量であるが、この値が小さいほどスムーズな合意形成が出てきている証であり、よいインタラクションが実現できていると結論付けられるにいたった。 実車両を使った実験の準備も着々と進めているが、自動車への実装の前に低速の小型のパーソナルモビリティでの実機実装を考えている。これは、ただ単に技術的ハードルを下げたというわけではなく、小型のパーソナルモビリティの方がより歩行者とのインタラクションの重要性が高まり、本課題の実証対象としてよりふさわしいと考えたためである。
|
今後の研究の推進方策 |
本研究では、①自身の行動による影響を明記した周辺他者の行動モデルの選定、②インタラクションを伴う行動データの観測と行動モデルの機械学習、③行動モデルを用いた予測と実時間での制約付き最適化による行動決定、④実現された知能の検証と評価、の4つの研究課題に取り組む予定であるが、今後は特に、以下の③と④に取り組む。 ③行動モデルを用いた予測と実時間での制約付き最適化による行動決定 予測情報に基づく実時間での制約付き最適化による行動決定は、モデル予測型知能のもう一つのコア技術である。運転行動への適用を考える場合、100[msec]以内での処理が求められるが、離散変数を多く含むモデルを持つ場合、その実現は容易ではない。本研究では、離遷移にあらかじめ複数の「シナリオ」を用意し、想定したシナリオの範囲内で離散状態遷移と動作の最適化を行う手法を検討したが、今年度はさらにランダマイズ度アプローチを導入して計算のさらなる高速化を図る。これにより実装が困難であった判断エントロピーを明示的に評価関数に組み込むことを可能とする。 ④実現された知能の検証と評価 過去2年間で開発した判断のあいまいさを考慮したMPCを小型のパーソナルモビリティに実装する。そして、実際に歩行者とのインタラクションがある状況下での実験を行い、パーソナルモビリティがとる行動の有用性を検証する。特に制御周期や評価関数の重みパラメータと制御性能との関係を定量的に分析し、状況に適したパラメータ設定を行う手法を確立する。パーソナルモビリティで検証ができた後は、自動車への実装についても検討し、企業との連携も視野に入れながらアルゴリズムのさらなる改良に取り組む。
|