2019 Fiscal Year Annual Research Report
Research on new machine learning method combining Exploitation-oriented Learning and Deep Learning
Project/Area Number |
17K00327
|
Research Institution | National Institution for Academic Degrees and Quality Enhancement of Higher Education |
Principal Investigator |
宮崎 和光 独立行政法人大学改革支援・学位授与機構, 研究開発部, 准教授 (20282866)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 強化学習 / 経験強化型学習 / 深層学習 / 深層強化学習 / ロボット |
Outline of Annual Research Achievements |
令和元年度では、応用例を拡充するために、まず第一に、研究代表者らがこれまで行ってきたKeepawayタスク、意識的意思決定システム、および、大学の卒業認定に関する方針を題材としたテキストマイニング研究の進展を図った。これらに加え、今年度から新たに、自動車運転者の眠気検知、ならびに、ツイートデータを利用した病気の症状判定といったヒトを中心に据えた応用例の探求を行うとともに、人工知能研究のテストベッドとして知られるAngry Birds AI Competitionへの参戦も行った。 これらのうち、自動車運転者の眠気検知、および、ツイートデータを利用した病気の症状判定に対しては、本研究課題の中心的手法である「深層学習に経験強化型学習XoLの成果を取り入れた手法」の適用を開始し、予備的実験においてその有効性を確認した。中でも、自動車運転者の眠気検知では迅速な判断が要求されるため、学習に要する試行錯誤回数の大幅削減を指向する本研究課題にとって特に適した応用先となっている。したがって、今年度の成果は、本研究課題の目的達成に大きく寄与するものである。 今後は、これらの応用例に対する提案手法のさらなる性能改善を目指し研究を進める予定でいる。なお、自動車運転者の眠気検知では、ヒューマノイド型ロボット「ナオ」と犬型ロボット「アイボ」を比較した予備的実験を開始しているが、本比較についても、今後さらなる実験を重ね、より広い視点から、提案手法の有効性の検証を行う予定である。 本研究課題では、昨年度までは、対象問題としてゲーム問題を中心に取り上げ、一定の条件下で、代表的な従来手法であるDQNの1/10以下での学習を実現してきた。それに加え、今年度では、新たにヒトを中心に据えた応用例の拡充を図った。このことは、今後、提案手法の広範囲な領域への拡大を強くサポートする結果であると考える。
|