2012 Fiscal Year Research-status Report
部分観測マルコフ決定過程理論に基づく発達尺度の言語関連タスクの包括的実現
Project/Area Number |
24500277
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Saga University |
Principal Investigator |
伊藤 秀昭 佐賀大学, 工学(系)研究科(研究院), 講師 (20345375)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | POMDP / 確率的最適制御 / 自然言語処理 / 発達尺度 / 多機能エージェント / 確率モデル / 適応制御 / 階層制御 |
Research Abstract |
本研究は、発達尺度のタスクのうちで言語に関連するものを多数行うことのできるエージェントを開発することを目的としている。その際、部分観測マルコフ決定過程(POMDP)理論を用いることによって、どのタスクを行うべきかの指示をエージェントが理解できるようにするとともに、各タスクの遂行においてどのような情報処理を行えばよいかを、エージェント自身が自動的に最適化できるようにすることを目指している。 本年度は、発達尺度のタスクのうちで言語に関連するものを複数個行うことのできるエージェントを作製する計画としており、例えば、「言葉を聞いて対応する絵を指さす(1歳7ヶ月レベル)」、「絵を見てその名称を答える(2歳0ヶ月レベル)」、「2本の棒を見てどちらが長いかを答える(2歳9ヶ月レベル)」、「円がいくつか描かれた絵を見て円の個数を答える(3歳9ヶ月レベル)」などから少なくとも2個以上のタスクを行えるようにする予定としていたが、上記のうち「2本の棒を見てどちらが長いかを答える(2歳9ヶ月レベル)」を除く3個のタスクについては概ね行えるようになった。さらに、個々のタスクをOpenRTM-aistを用いて複数のモジュールの組み合わせで実現するようにし、各タスクに対して、その実現に必要なモジュールの組合せを、モデル有り型強化学習を用いて自動的に最適化することにも成功した。また、物体の名称を聞いてその形状を推定するなどの、上記以外のタスクについても研究を進めることができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
各種タスクの実現については、前述の通り計画以上に進めることができた。しかし、未達成の事項として、指示をエージェントが理解する部分や、情報処理の最適化の部分に、POMDP理論に基づく手法を十分効果的に使用できていないことが挙げられる。 このように、計画以上に進んだ部分と、計画通りには進まなかった部分とがあるが、平均しておおむね順調に進展しているものと考える。進まなかった部分は次年度に取り返したい。
|
Strategy for Future Research Activity |
今後は、今年度未達成であった部分、すなわち、「指示をエージェントが理解したり、情報処理を最適化したりする際に、POMDP理論に基づく手法を使用する」という部分について研究を進める。それによって、当初の計画通り、タスクの種類を増やしても、指示に応じて適切な反応ができるようにすることや、各タスクの情報処理の最適化を短時間で行えるようにすることを目指す。 次項に記すように、今年度は、理論面を支える論文を準備することができたが、投稿まで至らなかった。これについては次年度早々に投稿したい。
|
Expenditure Plans for the Next FY Research Funding |
理論面を支える論文の投稿のために英文校正費用を残していたが,年度内に間に合わなかったため次年度に回すこととした。執筆はほぼ完了しているので次年度開始早々に使用する予定である。
|
Research Products
(9 results)