2018 Fiscal Year Final Research Report
Research on automatic generation of drawing songs for easy-to-understand object descriptions
Project/Area Number |
16K12455
|
Research Category |
Grant-in-Aid for Challenging Exploratory Research
|
Allocation Type | Multi-year Fund |
Research Field |
Perceptual information processing
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
Kanezaki Asako 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (00738073)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 物体認識 / 画像セグメンテーション / 機械学習 / マルチビュー画像 / 姿勢推定 / 教師なし学習 |
Outline of Final Research Achievements |
With the aim of explaining unknown objects in images with easy-to-understand expressions, we tackled to develop elemental technology for the automatic generation of drawing songs based on general object recognition. In order to describe an unknown object, humans generate a metaphorical expression such as "Like xxx" or "Like placing xxx on yyy", using some common and imaginable objects. In order to develop such a system, we proposed a novel 3D object recognition method using multi-view images. We also proposed an unsupervised image segmentation method that decomposes unknown objects in images into separated regions without using any prior knowledge.
|
Free Research Field |
画像処理
|
Academic Significance and Societal Importance of the Research Achievements |
第一に,様々な角度から物体を撮影し,一般的な名称を推論する三次元物体認識技術を開発した.本研究は深層学習を用いており,物体の姿勢の教師信号を人間が与えることなく,自動的に獲得できる点が新しい.提案手法は三次元物体検索の国際的コンペティションSHREC’17にて,二部門で世界第一位の性能を記録した.第二に,画像内の物体をパーツに分解する教師無し画像セグメンテーション技術を開発した.深層学習を用いた画像セグメンテーションの研究例は多く存在するが,そのほとんどが教師あり学習である.提案手法は畳み込みニューラルネットワークを用いるが,事前学習等の学習を一切必要としない点が新しい.
|