• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

コンテンツ・アウェアネスによる人と機械のコミュニケーション及び学習に関する研究

Research Project

Project/Area Number 26280059
Research InstitutionKobe University

Principal Investigator

有木 康雄  神戸大学, 都市安全研究センター, 教授 (10135519)

Co-Investigator(Kenkyū-buntansha) 滝口 哲也  神戸大学, 都市安全研究センター, 准教授 (40397815)
榎並 直子  神戸大学, 自然科学系先端融合研究環重点研究部, 助教 (80628925)
Project Period (FY) 2014-04-01 – 2017-03-31
Keywords音声対話 / 物体認識 / コミュニケーション / アウェアネス / 特定物体認識 / 一般物体認識 / 機能認識 / 学習
Outline of Annual Research Achievements

機械を相手にすると、話題に関する共通の認識(コンテンツ・アウェアネス)がとりにくく、人の意図が伝わりにくい。本研究では、このコンテンツ・アウェアネスを取り入れ、人と機械のコミュニケーションを円滑に行う方法について研究した。平成27年度は、認識結果を音声対話に組み込む方法と、対象に関する共通知識を用いた音声対話の有効性の検証について研究を行った。実施した研究内容を以下に述べる。
d)「認識・情報提供」においては、「赤いペンを取ってきて」とロボットに音声で指示すると、色と名称で指示された物体を特定する研究を行った。色属性の認識スコアーと名称に関する画像特徴の認識スコアー、及び音声認識のスコアーをロジスティック回帰で統合し、入力対象の中から音声で指示された色属性と名称属性を持つ対象を特定している。音声対話においては、POMDPを階層化する方法、および並列化する方法を研究し、発話者の意図推定時間の短縮を実現した。
e)「探索・処理操作」においては、ディープニューラルネットワークの一種であるConvolutional Neural Network (CNN)によって、一般物体認識を行った昨年度の研究成果を基に、音声認識と画像認識の結果を統合する前に、統合候補を絞り込む処理を導入した。これにより、音声と画像による一般物体の特定精度を向上させることができた。
f)「機能認識・探索」では、1000個の一般物体を識別することができる深層ネットワークの出力層に、新たに機能を識別するための深層ネットワークを付加して転移学習させた。画像特徴から識別できる機能としては、「水を入れることができる」、「動くことができる」、「書くことができる」に加えて「座ることができる」、「切ることができる」機能を付加して、5つの機能について認識を行った。この結果、73.8%の機能認識率を得た。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

人とロボットとの対話を想定し、話の対象に関して情報を求める「認識・情報提示」と、特定の対象を見つけて処理する「探索・処理操作」、特定の「機能」を持つ対象を見つける「機能認識・探索」をタスクとして実施し、新たな理論的展開と実験を行って研究成果を得ており、おおむね目的を達成している。

Strategy for Future Research Activity

画像認識として、特定物体認識、一般物体認識、機能認識について研究を進めてきた。今後、これを基に、その物体が置かれているコンテキストを利用して、精度を向上させる研究が必要であると考えている。また、対話によってわかったことを基にさらに対話を継続することで、知りたい情報を切れ目なく聞き出すことができる対話戦略の研究が必要であると思われる。

Causes of Carryover

研究の進捗に合わせて、物品の購入費用及び出張旅費を抑えたため、次年度使用額が生じた。

Expenditure Plan for Carryover Budget

研究成果及び状況に合わせて、次年度に物品の購入及び出張旅費を増やす計画である。

  • Research Products

    (15 results)

All 2016 2015

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (12 results) (of which Int'l Joint Research: 10 results)

  • [Journal Article] マルチモーダル情報を用いた色名称と物体名称に基づく物体特定2015

    • Author(s)
      小篠裕子, 有木康雄
    • Journal Title

      画像電子学会誌

      Volume: 45巻1号 Pages: 105-111

    • Peer Reviewed
  • [Journal Article] 一般物体認識に基づく音声で指示された物体の選択法2015

    • Author(s)
      西村仁志, 小篠裕子, 有木康雄, 中野幹生
    • Journal Title

      電子情報通信学会論文誌D

      Volume: Vol.J98-D,No.9 Pages: 1265-1276

    • Peer Reviewed
  • [Journal Article] Audio-Visual Speech Recognition Using Convolutive Bottleneck Networks for a Person with Severe Hearing Loss2015

    • Author(s)
      Yuki Takashima, Yasuhiro Kakihara, Ryo Aihara, Tetsuya Takiguchi, Yasuo Ariki, Nobuyuki Mitani, Kiyohiro Omori, Kaoru Nakazono
    • Journal Title

      IPSJ Transactions on Computer Vision and Applications

      Volume: Vol. 7 Pages: 64-68

    • Peer Reviewed
  • [Presentation] MODELING DEEP BIDIRECTIONAL RELATIONSHIPS FOR IMAGE CLASSIFICATION AND GENERATION2016

    • Author(s)
      Toru Nakashika, Tetsuya Takiguchi, Yasuo Ariki
    • Organizer
      ICASSP2016
    • Place of Presentation
      上海(中国)
    • Year and Date
      2016-03-22 – 2016-03-25
    • Int'l Joint Research
  • [Presentation] Estimation of Object Functions Using Convolutional Neural Network2016

    • Author(s)
      Yosuke Kitano, Tetsuya Takiguchi, Yasuo Ariki
    • Organizer
      The 22st Korea-Japan joint Workshop on Frontiers of Computer Vision
    • Place of Presentation
      ひだホテルプラザ(岐阜県・高山市)
    • Year and Date
      2016-02-17 – 2016-02-19
    • Int'l Joint Research
  • [Presentation] Rotation-invariant Histograms of Oriented Gradients for Local Patch Robust Representation2015

    • Author(s)
      Zhaojie Luo, Jinhui Chen, Tetsuya Takiguchi, and Yasuo Ariki
    • Organizer
      APSIPA Annual Summit and Conference 2015
    • Place of Presentation
      香港(中国)
    • Year and Date
      2015-12-16 – 2015-12-19
    • Int'l Joint Research
  • [Presentation] Detection of Facial Parts via Deformable Part Model Using Part Annotation2015

    • Author(s)
      Kazuhiro Nishida, Naoko Enami and Yasuo Ariki
    • Organizer
      APSIPA Annual Summit and Conference 2015
    • Place of Presentation
      香港(中国)
    • Year and Date
      2015-12-16 – 2015-12-19
    • Int'l Joint Research
  • [Presentation] 状態空間の分割と状態遷移の学習に基づく Parallel POMDPの評価2015

    • Author(s)
      山田 燿司, 滝口 哲也, 有木 康雄
    • Organizer
      電子情報通信学会技術研究報告 (SP)
    • Place of Presentation
      六甲ホール(兵庫県・神戸市)
    • Year and Date
      2015-10-15 – 2015-10-16
  • [Presentation] Multithreading AdaBoost Framework for Object Recognition2015

    • Author(s)
      Jinhui Chen, Tetsuya Takiguchi, and Yasuo Ariki
    • Organizer
      The IEEE International Conference on Image Processing (ICIP) 2015
    • Place of Presentation
      Québec City (Canada)
    • Year and Date
      2015-09-27 – 2015-09-30
    • Int'l Joint Research
  • [Presentation] Facial Expression Recognition with Multithreaded Cascade of Rotation-invariant HOG2015

    • Author(s)
      Jinhui Chen, Tetsuya Takiguchi, and Yasuo Ariki
    • Organizer
      The sixth International Conference on Affective Computing and Intelligent Interaction (ACII2015)
    • Place of Presentation
      西安(中国)
    • Year and Date
      2015-09-21 – 2015-09-24
    • Int'l Joint Research
  • [Presentation] SPOKEN DIALOGUE SYSTEM FOR PRODUCT RECOMMENDATION USING HIERARCHICAL POMDP2015

    • Author(s)
      Yoji Yamada, Tetsuya Takiguchi, Yasuo Ariki
    • Organizer
      2015 First International Workshop on Machine Learning in Spoken Language Processing (MLSLP)
    • Place of Presentation
      会津大学 (会津市・福島県)
    • Year and Date
      2015-09-19 – 2015-09-20
    • Int'l Joint Research
  • [Presentation] FEATURE EXTRACTION USING PRE-TRAINED CONVOLUTIVE BOTTLENECK NETS FOR DYSARTHRIC SPEECH RECOGNITION2015

    • Author(s)
      Yuki Takashima, Toru Nakashika, Tetsuya Takiguchi, Yasuo Ariki
    • Organizer
      The 23rd European Signal Processing Conference (EUSIPCO)
    • Place of Presentation
      Nice (France)
    • Year and Date
      2015-08-31 – 2015-09-04
    • Int'l Joint Research
  • [Presentation] Word-Error Correction of Continuous Speech Recognition Based on Normalized Relevance Distance2015

    • Author(s)
      Yohei Fusayasu, Katsuyuki Tanaka, Tetsuya Takiguchi, Yasuo Ariki
    • Organizer
      International Joint Conference on Artificial Intelligence 2016
    • Place of Presentation
      Buenos Aires (Argentina)
    • Year and Date
      2015-07-25 – 2015-07-31
    • Int'l Joint Research
  • [Presentation] Content-based Image Retrieval Using Rotation-invariant Histograms of Oriented Gradients2015

    • Author(s)
      Jinhui Chen, Toru Nakashika, Tetsuya Takiguchi, and Yasuo Ariki
    • Organizer
      ACM ICMR 2015
    • Place of Presentation
      上海(中国)
    • Year and Date
      2015-06-23 – 2015-06-24
    • Int'l Joint Research
  • [Presentation] Deformable Part Modelを用いた顔部品検出2015

    • Author(s)
      西田 和博,榎並 直子,有木 康雄
    • Organizer
      電子情報通信学会技術研究報告 (PRMU)
    • Place of Presentation
      新潟大学駅南キャンパス「ときめいと」 (新潟県・新潟市)
    • Year and Date
      2015-06-18 – 2015-06-19

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi