2014 Fiscal Year Research-status Report
部分観測マルコフ決定過程理論に基づく発達尺度の言語関連タスクの包括的実現
Project/Area Number |
24500277
|
Research Institution | Saga University |
Principal Investigator |
伊藤 秀昭 佐賀大学, 工学(系)研究科(研究院), 講師 (20345375)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | POMDP / 確率的最適制御 / 自然言語処理 / 発達尺度 / 多機能エージェント / 確率モデル / 適応制御 / 階層制御 |
Outline of Annual Research Achievements |
本研究は、発達尺度のタスクのうちで言語に関連するものを多数行うことのできるエージェントを開発することを目的としている。その際、部分観測マルコフ決定過程(POMDP)理論を用いることによって、どのタスクを行うべきかの指示をエージェントが理解できるようにするとともに、各タスクの遂行においてどのような情報処理を行えばよいかを、エージェント自身が自動的に最適化できるようにすることを目指している。 今年度は、タスクの数が増えた場合の検討を行った。特に、各タスクの遂行においてどのような情報処理を行えばよいかをエージェント自身が自動的に最適化する部分について、主に学習の側面から研究を進めることができた。この最適化は、画像認識や音声認識など個別の情報処理を行うモジュールをあらかじめいくつか用意しておき、それらをタスクごとに適切な順序で組み合わせて用いることで、それぞれのタスクに必要な情報処理を実現するというものであるが、昨年度までは、その最適化のために必要な各モジュールの動作モデルを設計者が手で与える必要があり、非常に手間がかかっていた。そこで今年度は、エージェントが自らの経験に基づいて各モジュールの動作モデルを自動的に学習できるようにした。さらに、帰納論理プログラミングを用いて汎化学習を可能にしたことで、タスクの数が増えても少数の経験から学習できるようにし、例えばタスクの数が12個の場合に、100試行程度で学習可能であることなどを示した。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
発達尺度の言語関連タスクを多数実現することと、どのような情報処理をすればよいかを最適化することに関しては、ある程度研究を進めることができた。しかし、指示の理解についてまだあまり研究を進めることができていない。また、情報処理の最適化に関して階層的な確率モデルを用いた最適化手法を検討したが、性能評価に想定以上に時間がかかり論文発表が遅れてしまったため、次年度の課題としたい。
|
Strategy for Future Research Activity |
研究期間を一年延長していただいたため、未達成の部分の研究を着実に行う。
|
Causes of Carryover |
ロボットが故障したことや、性能評価のために想定以上に時間がかかったことにより、論文投稿が遅れてしまった。そのため、投稿用に残していた額(英文校正費を含む)が未使用となってしまった。
|
Expenditure Plan for Carryover Budget |
論文投稿用に使用する。
|