Project/Area Number |
15650030
|
Research Category |
Grant-in-Aid for Exploratory Research
|
Allocation Type | Single-year Grants |
Research Field |
Perception information processing/Intelligent robotics
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
長橋 宏 東京工業大学, 大学院・理工学研究科, 教授 (20143084)
|
Co-Investigator(Kenkyū-buntansha) |
諸岡 健一 東京工業大学, 大学院・理工学研究科, 助手 (80323806)
|
Project Period (FY) |
2003 – 2004
|
Project Status |
Completed (Fiscal Year 2004)
|
Budget Amount *help |
¥3,300,000 (Direct Cost: ¥3,300,000)
Fiscal Year 2004: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2003: ¥2,200,000 (Direct Cost: ¥2,200,000)
|
Keywords | 3次元モデル / 区分的多項式表現 / 形状変形 / 外環境 / 動作機能 / 連続体力学 / 強化学習 / 多項式表現 / 制御点移動 / 自律的学習 / actor-critic |
Research Abstract |
本研究では、『変形拘束条件を持つ物体モデルが、与えられた外環境の中で自律的に面形状を制御し、動作機能を生じさせることで目標地点に到達するプロセスを学習・獲得する』という枠組を持つ新たな3次元物体表現法を構築することを目的とした。通常の3次元モデル表現が静的な物体形状のみを表し、物体の動きに関しては形状表現とは別にスケルトンモデル等を用いて個別に表現が行われているのに対して、本研究で提案するモデル表現法では、物体モデルが置かれる外環境と目標に応じて、物体の形状変形を引き起こす面の制御点の時間的推移の仕方を自律的に学習することができる。そのため、環境が変わっても自律的に適応可能なエージェント型の3次元物体モデル表現となっており、形状変形と与えられた外環境との相互作用を行う機能を持った物体表現となる。本研究では、区分的多項式表現モデルを利用し、ごく限られた数の制御点の時間関数として動きを表現するとともに、3次元外環境空間における物体の変形と移動を評価するための基準を連続体力学の観点から検討し、それらの評価基準に基づいて形状変形プロセスを学習するシステムを実際に作成した。学習法としては、強化学習法の1つであるQ-learningを用いた。複数の形状モデルに対して、面の変形拘束条件を与えた場合の物体の動きの解析を行った結果、いわゆる水中や地上のような異なる外環境においても、本提案手法に基づいて目標点に到達するための面形状の変形プロセスをそれぞれに獲得することができた。さらに、面の変形拘束条件を変えた場合でも、同一環境、同一目標点に到達するための新たな変形プロセスも獲得できることが明らかとなった。
|
Report
(2 results)
Research Products
(7 results)