抽象的な概念を表す符号を自律的に学習するための自己符号化器の構成方法の開発
Project/Area Number |
21K12079
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61050:Intelligent robotics-related
|
Research Institution | Ritsumeikan University |
Principal Investigator |
松尾 直志 立命館大学, 情報理工学部, 助教 (80449545)
|
Co-Investigator(Kenkyū-buntansha) |
島田 伸敬 立命館大学, 情報理工学部, 教授 (10294034)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2023: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2021: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
|
Keywords | 機械学習 / コンピュータビジョン / 教師なし学習 / 自己符号化器 |
Outline of Research at the Start |
人は初めて見る物体であっても、それを他の人がどのように扱うかを観察することで持ち方や使い方を把握できる。この能力を計算機上で実現できれば、計算機が自律的に学習し知識を獲得していくことができるので、生活空間で働く賢いロボットの開発に有用と期待できる。しかし、例えば物体の持ち方では様々な見え方があるため、画像情報だけから人手に依らず典型的な持ち方のグループを把握するのは難しかった。そこで本研究ではそのような、様々な見え方(観測)がある対象に対して事前に典型的な持ち方などの教師情報を教えることなくその対象が持つ本質的な情報を計算機上に自動的に構成することを目指す。
|
Outline of Annual Research Achievements |
観測によって得られるデータから対象の性質に応じた符号を割り当てる方法を、ネギやコーンのような粒状食材を把持する問題に適用する研究を行った。粒状食材をロボットハンドによって把持するとき、把持される重量は把持を行う場所での粒状食材の状況に依存する。また、粒状食材は多数ありそれぞれが変形することもあるため、それらの挙動を解析的に予測することは困難であり、確率分布を推定することとした。把持重量の確率分布はハンドの動作によっても変化するため、ハンドによる把持重量を推定する問題においては「その場所でのハンドの動作と確率分布の関係を表す情報」が粒状食材の状況を表す符号であると見なせる。粒状食材の見た目と凹凸を表すRGBD画像からこの符号を推定する方法を開発し、実際の把持実験とよく整合することを確認した。 粒状食材の配置は把持実験を行うたびに破壊的に変更されるうえ、同じ状況を再現することもできないため、同一状況に対して繰り返し実験を行うことで「ハンドの動作と把持重量確率分布の関係」を直接推定することはできない。そこで、仮に推定した符号から確率分布を求め、それによって定まる尤度が大きくなるよう符号を最適化していくことで、RGBD画像から粒状食材の状況を表す符号を得る方法を提案した。実験ではハンドの動作量としては差し込み深さを考え、それぞれの差し込み深さに対して把持重量確率分布を推定する仕組みとしたが、最尤法の考えに基づいて開発した提案方法はより多次元の動作量を用いることも、より多次元の量についての確率分布を推定するためにも拡張可能である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年度終了時点で提出した計画では2022年度には、3次元立体形状を撮影した画像から3次元形状それ自体を表現する符号を生成する方法として、回転や拡大縮小などの人工的な変換に関して不変な符号を与えるautoencoderを構成する方法について研究する予定であった。しかし、ロボットハンドによる粒状食材の把持重量の推定問題において、粒状食材の状況を表す符号を推定する手法の開発が進展したためこちらを優先した。これは人工的な変換ではなく実際の実験を行うことによって収集したデータに基づいて推定を行う方法であり、また把持重量という対象(粒状食材の状況)の類似性を表す手掛りを活用する方法であり当初予定において2022年度及び2023年度に取り組む予定であった内容に重なるものである。 開発した把持重量の確率分布を推定する方法では、 粒状食材状況それぞれについての把持重量の確率分布という、 食材状況を明示的に分類しなければ推定することが難しかったものを 状況を明示的に分類することなく推定することに成功している。 また、これによって一定量の食材を把持するためのハンド動作量の 推定も行うことができ、単に符号を生成するだけでなくそれを用いた 具体的な応用に近いものとなっている。
|
Strategy for Future Research Activity |
粒状食材の状況に符号を割り当ててロボットハンドの動作量と把持重量確率分布との関係を推定する手法では、ハンドの動作量としては差し込み深さという1次元量を考え、推定するものは把持重量という1次元量についての確率分布であった。今回開発した枠組みは最尤法に基づく方法であり、上記のような1次元量に対してだけでなくより多次元の量に対しても適用可能である。 そこで、これを多次元の量を用いる問題に適用し効果を確認することを検討する。具体的な例としては、細かい凹凸のある不整地を走行する車の移動量を凹凸状況から推定する問題が考えられる。推定する移動量は2次元のものが考えられ、ロボットの動作量としては走行車のハンドル情報や速度情報など2次元以上のものが考えられる。
|
Report
(2 results)
Research Products
(3 results)