研究課題/領域番号 |
12750204
|
研究種目 |
奨励研究(A)
|
配分区分 | 補助金 |
研究分野 |
知能機械学・機械システム
|
研究機関 | 東京大学 |
研究代表者 |
矢入 健久 東京大学, 先端科学技術研究センター, 助手 (90313189)
|
研究期間 (年度) |
2000 – 2001
|
研究課題ステータス |
完了 (2001年度)
|
配分額 *注記 |
2,200千円 (直接経費: 2,200千円)
2001年度: 400千円 (直接経費: 400千円)
2000年度: 1,800千円 (直接経費: 1,800千円)
|
キーワード | 知能ロボット / 機械学習 / 情報理論 / 概念学習 / 強化学習 / 環境地図獲得 / 状態抽象化 / 行動獲得 |
研究概要 |
本研究の最終年度である本年度は、主に2つの具体的なタスクを対象として取り上げ、ロボットの学習戦略に関する本研究の提案手法を適用した。その2つのタスクとは、・環境報酬に基づく反射的ルール獲得・定性的な観測情報に基づく環境地図の学習である。まず、前者については、従来ロボット学習の分野では別個に扱われてきた帰納的概念学習法と強化学習法とを統合する方法を情報理論的な立場から提案した。この成果は別掲のように雑誌論文で発表済みである。 また、後者については、従来ロボット設計者が暗黙のうちにプログラムに埋め込んでいた環境に関する定性的知識をロボット自身が処理し、環境地図を学習する新しい手法を提案した。この成果も国際学会等で発表され、また雑誌論文に投稿中である。 以上のように、本研究で得られた成果はロボット学習分野において非常に新規性・意義に富んだものであり、本課題が終了した後もさらに発展的なテーマに取り組んで行く予定である。
|