• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

物体の分かりやすい説明表現のための絵描き歌自動生成に関する研究

研究課題

研究課題/領域番号 16K12455
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 知覚情報処理
研究機関国立研究開発法人産業技術総合研究所

研究代表者

金崎 朝子  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (00738073)

研究期間 (年度) 2016-04-01 – 2019-03-31
研究課題ステータス 完了 (2018年度)
配分額 *注記
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2017年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2016年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
キーワード物体認識 / 画像セグメンテーション / 機械学習 / マルチビュー画像 / 姿勢推定 / 教師なし学習 / 画像認識 / コンピュータビジョン / 自然言語処理 / パターン認識
研究成果の概要

写真に写っている物体を分かりやすい表現で説明することを目指し,物体認識技術を応用した絵描き歌自動生成システムの要素技術開発に取り組んだ.未知の物体を言語で表現するとき,人はよりイメージしやすい物体を用いて「○○のような」「××を△△に乗せたような」といった比喩的表現を生成する.これを機械が実現するために,様々な角度から物体を撮影して一般的な名称を推論する物体認識技術の開発,および事前知識を使用せず,画像内の物体をパーツに分解する教師無し画像セグメンテーション技術の開発を行った.

研究成果の学術的意義や社会的意義

第一に,様々な角度から物体を撮影し,一般的な名称を推論する三次元物体認識技術を開発した.本研究は深層学習を用いており,物体の姿勢の教師信号を人間が与えることなく,自動的に獲得できる点が新しい.提案手法は三次元物体検索の国際的コンペティションSHREC’17にて,二部門で世界第一位の性能を記録した.第二に,画像内の物体をパーツに分解する教師無し画像セグメンテーション技術を開発した.深層学習を用いた画像セグメンテーションの研究例は多く存在するが,そのほとんどが教師あり学習である.提案手法は畳み込みニューラルネットワークを用いるが,事前学習等の学習を一切必要としない点が新しい.

報告書

(4件)
  • 2018 実績報告書   研究成果報告書 ( PDF )
  • 2017 実施状況報告書
  • 2016 実施状況報告書
  • 研究成果

    (10件)

すべて 2019 2018 2016 その他

すべて 学会発表 (8件) (うち国際学会 3件) 図書 (1件) 備考 (1件)

  • [学会発表] Salient object detection on hyperspectral images using features learned from unsupervised segmentation task2019

    • 著者名/発表者名
      Nevrez Imamoglu, Guanqun Ding, Yuming Fang, Asako Kanezaki, Toru Kouyama, and Ryosuke Nakamura
    • 学会等名
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    • 関連する報告書
      2018 実績報告書
    • 国際学会
  • [学会発表] Unsupervised Image Segmentation by Backpropagation2018

    • 著者名/発表者名
      Asako Kanezaki
    • 学会等名
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] RotationNet: Joint Object Categorization and Pose Estimation Using Multiviews from Unsupervised Viewpoints2018

    • 著者名/発表者名
      Asako Kanezaki, Yasuyuki Matsushita, and Yoshifumi Nishida.
    • 学会等名
      IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] 視点教示なし多視点画像深層学習による物体のカテゴリ・姿勢同時推定2018

    • 著者名/発表者名
      金崎 朝子、松下 康之、西田 佳史
    • 学会等名
      画像センシングシンポジウム
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] IBC127: Video Dataset for Fine-grained Bird Classification2016

    • 著者名/発表者名
      Tomoaki Saito, Asako Kanezaki
    • 学会等名
      IEEE International Conference on Multimedia & Expo (ICME)(国際学会)
    • 発表場所
      The Westin Seattle(シアトル, WA, アメリカ)
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] Kinect等の色距離センサを用いた点群処理と3D物体認識―ベーシックな手法と最新動向・ソフトウェアの紹介―2016

    • 著者名/発表者名
      金崎朝子
    • 学会等名
      第22回 画像センシングシンポジウム(SSII2016)(招待講演)
    • 発表場所
      パシフィコ横浜(神奈川県横浜市)
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] 色距離センサを用いた点群処理と三次元物体認識に関する研究紹介2016

    • 著者名/発表者名
      金崎朝子
    • 学会等名
      画像応用技術専門委員会2016年度第3回研究会(招待講演)
    • 発表場所
      中央大学後楽園キャンパス(東京都文京区)
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] 画像認識とロボティクスにおける人工知能研究の現状2016

    • 著者名/発表者名
      金崎朝子
    • 学会等名
      (公財)長野県テクノ財団 アルプスハイランド地域センター「旬」の技術研究会(招待講演)
    • 発表場所
      長野県工業技術総合センター(長野県松本市)
    • 関連する報告書
      2016 実施状況報告書
  • [図書] Multimodal Scene Understanding2019

    • 著者名/発表者名
      Michael Ying Yang, Bodo Rosenhahn, Vittorio Murino
    • 総ページ数
      525
    • 出版者
      Elsevier
    • ISBN
      9780128173589
    • 関連する報告書
      2018 実績報告書
  • [備考] Unsupervised Image Segmentation by Backpropagation

    • URL

      https://kanezaki.github.io/pytorch-unsupervised-segmentation/

    • 関連する報告書
      2017 実施状況報告書

URL: 

公開日: 2016-04-21   更新日: 2020-03-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi