2013 Fiscal Year Research-status Report
部分観測マルコフ決定過程理論に基づく発達尺度の言語関連タスクの包括的実現
Project/Area Number |
24500277
|
Research Institution | Saga University |
Principal Investigator |
伊藤 秀昭 佐賀大学, 工学(系)研究科(研究院), 講師 (20345375)
|
Keywords | POMDP / 確率的最適制御 / 自然言語処理 / 発達尺度 / 多機能エージェント / 確率モデル / 適応制御 / 階層制御 |
Research Abstract |
本研究は、発達尺度のタスクのうちで言語に関連するものを多数行うことのできるエージェントを開発することを目的としている。その際、部分観測マルコフ決定過程(POMDP)理論を用いることによって、どのタスクを行うべきかの指示をエージェントが理解できるようにするとともに、各タスクの遂行においてどのような情報処理を行えばよいかを、エージェント自身が自動的に最適化できるようにすることを目指している。 昨年度は、発達尺度のタスクのうちで言語に関連するものを複数個行うことのできるエージェントを作製する計画としており、「言葉を聞いて対応する絵を指さす(1歳7ヶ月レベル)」、「絵を見てその名称を答える(2歳0ヶ月レベル)」、「円がいくつか描かれた絵を見て円の個数を答える(3歳9ヶ月レベル)」などについては行えるようになった。今年度は、それに加えて「2本の棒を見てどちらが長いかを答える(2歳9ヶ月レベル)」などについて研究を進め、まだ完成には至っていないが、行える目処がついた。 また、昨年度は、各タスクの遂行においてどのような情報処理を行えばよいかについて、モデル有り型強化学習を用いて自動的に最適化することに成功していたが、今年度は、モデル有り型強化学習に汎化能力を持たせ、最適化に要する時間を短縮させることに成功した。また、強化学習ではなく、階層的な確率モデルを用いた最適化手法を用いるアプローチについても研究し、実装までは行うことができた(現在、性能評価を行っている)。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
前述の通り進展はしたが、まだ完成していない部分が多い。特に、指示をエージェントが理解する部分に、POMDP理論に基づく手法を十分効果的に使用できていない。また、本年度は、発達尺度に詳しい心理学の専門家に判定してもらう予定であったが、それもできなかった。遅れている理由は、今年度は研究以外の業務が多く研究を行える時間が少なかったためであり、研究上で特に問題が発生しているわけではない。
|
Strategy for Future Research Activity |
今後は、未達成の部分について研究を進める。特に、「指示をエージェントが理解したり、情報処理を最適化したりする際に、POMDP理論に基づく手法を使用する」という部分について研究を進める。それによって、当初の計画通り、タスクの種類を増やしても、指示に応じて適切な反応ができるようにすることや、各タスクの情報処理の最適化を短時間で行えるようにすることを目指す。
|
Expenditure Plans for the Next FY Research Funding |
雑誌論文掲載費として残していたが、今年度中に間に合わなかったため次年度使用とした。 元の予定通り、雑誌論文掲載費として使用する。
|
Research Products
(8 results)