研究課題/領域番号 |
19K12157
|
研究機関 | 佐賀大学 |
研究代表者 |
伊藤 秀昭 佐賀大学, 理工学部, 准教授 (20345375)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 確率的情報処理 / POMDP / 認知アーキテクチャ / Physical RPA / 行動最適化 |
研究実績の概要 |
本研究の目的は、ヒトの様々な「考える」能力を包括的に実現でき、理論的基盤がしっかりしていて工学的に応用しやすい認知アーキテクチャを構築することである。具体的には、既存の認知アーキテクチャを部分観測マルコフ決定過程(POMDP)理論に基づいて定式化し直すこと、そしてAlpha Zeroなどの高性能な最適化手法を用いてその解法を実装すること、またフィジカルRPAという実問題に応用し、構築したアーキテクチャの有効性を明らかにすることを目的としている。 初年度は、まずPOMDPに基づいて既存の認知アーキテクチャを定式化し直し、Alpha Zeroを改良して実装すること、そして計算機上で数値実験を行い、提案手法の性能を確かめることを計画していた。同時に、フィジカルRPAのための基本的な技術を確立させること、特に、本研究では最もニーズがあると考えられる「紙を用いる作業」の自動化を行う計画であるため、その基本技術を確立させることを計画していた。 計画の前半部分に関しては、既存の認知アーキテクチャを定式化し、Alpha Zeroではないが他の最適化手法を用いて実装することができた。計算機上で数値実験を行い、提案手法の性能を確かめることもできた。これらの成果に関しては近日中に論文を投稿予定である。また、認知アーキテクチャではないが他の問題を対象としてAlpha Zeroを改良した実装を行うことができ、論文を投稿した。後半部分に関しては、紙のソートを行うシステムを一通り完成させることができた。これについても近日中に論文投稿予定である。また、ロボットの制御技術についても研究を進め、論文を発表することができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
「研究実績の概要」欄に記した通り、既存の認知アーキテクチャをPOMDPを用いて定式化し、Alpha Zeroではないが他の最適化手法を用いて実装すること、および、認知アーキテクチャではないが他の問題を対象としてAlpha Zeroを改良した実装を行うことはできた。しかし、そこまでに時間を要してしまい、両者をまとめて、認知アーキテクチャに対してAlpha Zeroを改良した実装を行うところまで研究を進めることができなかった。
|
今後の研究の推進方策 |
まず、初年度に十分行うことのできなかった、認知アーキテクチャに対してAlpha Zeroを改良した実装を行う研究を進める。また、当初の計画通り、提案した認知アーキテクチャをフィジカルRPAに応用し、実問題への応用が容易かを明らかにする研究を行う。具体的には、紙のスキャン(大きさの不揃いな紙を一枚ずつめくり自動的にスキャンする)や多数の紙への手書き文字の記入などを予定している。実ロボットで紙を取り扱う際には多様なトラブル(紙が散らばるなど)が発生すると予想されるが、それらへの対処法は予めロボットに一つ一つ教えておくのではなく、認知アーキテクチャによってサブゴールを設定したり失敗から学んだりしてロボットが自ら考えるようにする予定である。
|
次年度使用額が生じた理由 |
論文投稿費として残していたが,年度内に間に合わなかったため次年度に使用させていただきたい。
|