2015 Fiscal Year Annual Research Report

部分観測マルコフ決定過程理論に基づく発達尺度の言語関連タスクの包括的実現

Research Project

Project/Area Number	24500277
Research Institution	Saga University
Principal Investigator	伊藤秀昭佐賀大学, 工学(系)研究科(研究院), 講師 (20345375)
Project Period (FY)	2012-04-01 – 2016-03-31
Keywords	POMDP / 確率的最適制御 / 自然言語処理 / 発達尺度 / 多機能エージェント / 確率モデル / 適応制御 / 階層制御
Outline of Annual Research Achievements	本研究では、発達尺度のタスクのうちで言語に関連するものを多数行うことのできるエージェントを開発することを目的とした。その際、部分観測マルコフ決定過程(POMDP)理論を用いることによって、どのタスクを行うべきかの指示をエージェントが理解できるようにするとともに、各タスクの遂行においてどのような情報処理を行えばよいかを、エージェント自身が自動的に最適化できるようにすることを目指した。前年度までで、「言葉を聞いて対応する絵を指さす(1歳7ヶ月レベル)」、「絵を見てその名称を答える(2歳0ヶ月レベル)」、「2本の棒を見てどちらが長いかを答える(2歳9ヶ月レベル)」、「円がいくつか描かれた絵を見て円の個数を答える(3歳9ヶ月レベル)」などのタスクを行えるようにした。また、タスクの遂行を細かな処理モジュールの組み合わせで実現するようにし、どのように各モジュールを組み合わせれば求められたタスクを遂行できるかをエージェント自身がモデル有り型強化学習により自動的に最適化できるようにした。その際に必要となる各モジュールの動作モデルはエージェントが経験から自動的に学習できるようにし、その学習には帰納論理プログラミングを用いて汎化能力をもたせたことで、タスクの数が増えても少数の経験から学習できるようにした。本年度はさらに、強化学習ではなく階層的な確率モデルを用いた最適化手法を用いるアプローチに関して研究を進めた。特に、階層的な確率モデルの学習に関して論文を発表することができた。