情報通信技術を用いてネットワークに接続する様々な端末から情報を収集し、消費電力の削減等の目的に応じた機器制御を行うサービスが人の生活環境へも拡がりつつある。特に生活環境では、ユーザの満足度を考慮しつつ目的を達成することが要求される。一方、公共空間やオフィス環境では、多種多様な嗜好を有するユーザが生活するため、全てのユーザの満足度を考慮した機器制御は容易ではない。本研究課題では、異なる嗜好を有するユーザが生活する環境において、制御目的の達成とユーザの満足度の充足が両立可能な機器制御を提案する。本研究では、ユーザの感情、嗜好、反応を識別するユーザの満足度モデルを提案し、満足度モデルを用いた合意形成による機器制御手法を提案・研究開発する。
本年度は、昨年度取り組んだ強化学習を用いた制御方法を拡張し、(1)消費電力とユーザ満足度の優先度を任意に設定可能な手法の提案、(2)外気温によるユーザへの影響を考慮した合意形成を用いた制御手法の提案、(3)ユーザモデルがないユーザがいる場合における学習器選択アルゴリズムの提案、の3つに取り組んだ。
これらの研究の結果、(1)では5人のユーザモデルを与えた時に強化学習によって得られた学習器を用いることで、最適値と比較してほぼ同様、最低でも約95%近似する制御ができることを明らかにし、また優先度に応じて報酬値が高い制御値を選択できることを明らかにした。また、(2)外気温の伝達モデルを提案し、外気温の変化による温度上昇を考慮することで、適切に制御できることを明らかにした。さらに(3)では、複数の学習器の中からユーザモデルを構築していないユーザがいた場合でも報酬値が高くなる制御値を導くことができる学習器を選択できることを明らかにした。また、(1)は査読付き国際会議1件に採択され、発表を行っており現在論文誌への投稿準備中である。
|