• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

PBLの個人評価を目的とする活動音の可視化技術

Research Project

Project/Area Number 15K01069
Research InstitutionWakayama University

Principal Investigator

西村 竜一  和歌山大学, システム工学部, 助教 (00379611)

Co-Investigator(Kenkyū-buntansha) 原 直  岡山大学, 自然科学研究科, 助教 (50402467)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords音声情報処理 / PBL / 可視化 / 笑い声 / 足音 / 環境音
Outline of Annual Research Achievements

本研究では、「音」の可視化を基盤技術とし、学生のアクティビティ測定法を提案する。提案法を大学等の高等教育機関で導入が進むPBL(プロジェクト型学習、課題解決型学習)の教育現場で試行することを目指す。
既存の音声認識システムでは、実環境下のくだけた会話や複雑に入り組んだ対話をすべて正確に書き起こすことは困難である。このため、昨年度から引き続き、活性度を示す重要なファクタの一つである「笑い声」に着目した検討を進めた。4人の協力者によるグループワークを収録した映像データに対し、人手で「盛り上がり」のメタデータを付与するためのシステムを実装し、笑い声と盛り上がりの相関を分析した。この作業過程では、付与情報の正確性が問題となったため、アノテーション作業の効率化を支援するシステムが必要になった。そこで、マルチポインティングに対応したタッチパネルを利用したユーザインタフェースを試作した。この結果、参加者4人の発話に対し、同時かつ効率的に、盛り上がりを示すメタデータを付与できるようになった。
加速度、ジャイロ、地磁気や圧力のセンシングデータと時間同期した「足音」の音響信号の収録システムを開発した。学生プロジェクト活動に参加する学生7名の協力を得て、7時間分の歩行データ(音響信号、センシングデータ)を収集した。深層学習型ニューラルネットワークを利用することで、センシングデータを変換、足音の音響信号を合成する手法を提案し、足音の統計的モデル化を検討した。
同一空間内に多数存在する音源情報を可視化するため、収録したパラメタから音源情報に変換するための認識器およびその特徴量について検討を加えた。深層学習型ニューラルネットワークに基づく手法であるLSTM、CNN、CNN-LSTMを比較した結果、CNN-LSTMにおいて高い精度を確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

PBL学修者のアクティビティを視覚的に把握できるようにすることを目的にした「音」の可視化技術の開発は、収録データから抽出したパラメタの抽象化や統計的モデル化に基づいて着実に進展している。深層学習型ニューラルネットワークを導入することで、音響信号の識別アルゴリズムの性能向上を確認することができた。また、深層学習型ニューラルネットワークをセンシングデータと音響信号の変換システムとして利用することで、足音のモデル化の手法について知見を得ることができた。アノテーション作業のための新しいユーザインタフェースの開発によって、収録データの整備を効率化することができ、次年度以降の研究に問題なく取り組める状況にある。
以上から、本研究は、おおむね順調に進展していると考える。

Strategy for Future Research Activity

引き続き、パラメタの抽象化や識別アルゴリズムの改良を通じて、可視化の精度向上を目指す。並行して、多様性をカバーするためには、実験資料である収録データの拡充が必要がある。PBLに参加する学生を協力者とし、グループワークを収録する。
収録システムをネットワークに接続し、データをサーバに自動集約するためのオンラインシステムを開発する。また、サーバ上でモデルを逐次的に更新する機構の導入を検討する。
収集したデータを整備する過程において、試作したユーザインタフェースを備えたアノテーション支援システムを評価する。誤った付与情報を除外し、データの信頼性を確保できるようにするため、複数の学修者と指導者が協調的にアノテーションを付与できるようにインタフェースを拡張する。
小型ボードコンピュータ(Raspberry Pi)を用いて試作したデータ収録及び可視化情報提示のプロトタイプシステムを改良する。超小型マイクロホン等を搭載、ハードウェア全体を小型化して利便性及び完成度の向上を目指す。

Causes of Carryover

ハードウェアのモデルチェンジにより、当初予定より機器を安価に導入することができたため。

Expenditure Plan for Carryover Budget

人件費(研究協力謝金)に充てることで、データの拡充(収録及び整備)を進める。
小型ボードコンピュータをまとまった数量(10セット程度)購入し、データ収録・可視化情報提示システムの実用レベルを製品相当まで向上できるように改良を加える。

  • Research Products

    (8 results)

All 2017 2016 Other

All Presentation (7 results) Remarks (1 results)

  • [Presentation] ユーザ訂正情報に基づいた音声認識API出力の並び替え法2017

    • Author(s)
      遠山智明, 西村竜一, 入野俊夫
    • Organizer
      日本音響学会2017年春季研究発表会
    • Place of Presentation
      明治大学生田キャンパス(神奈川県川崎市)
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] スマートフォンで収録した環境音データベースを用いたCNNによる環境音分類2017

    • Author(s)
      鳥羽隼司, 原直, 阿部匡伸
    • Organizer
      日本音響学会2017年春季研究発表会
    • Place of Presentation
      明治大学生田キャンパス(神奈川県川崎市)
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 歩行動作のセンシングデータを入力とした足音合成2017

    • Author(s)
      吉田赳, 西村竜一, 入野俊夫
    • Organizer
      情報処理学会インタラクション2017
    • Place of Presentation
      明治大学中野キャンパス (東京都中野区)
    • Year and Date
      2017-03-02 – 2017-03-04
  • [Presentation] 深層学習を用いたゲームコンテンツのための効果音自動生成手法の検討2016

    • Author(s)
      吉田赳, 入野俊夫, 西村竜一
    • Organizer
      日本音響学会第19回関西支部若手研究者交流研究発表会
    • Place of Presentation
      関西大学100周年記念会館(大阪府吹田市)
    • Year and Date
      2016-12-18 – 2016-12-18
  • [Presentation] ユーザ訂正情報を用いた音声認識APIのカスタマイズ手法2016

    • Author(s)
      遠山智明, 西村竜一, 入野俊夫
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      富山大学五福キャンパス(富山県富山市)
    • Year and Date
      2016-09-14 – 2016-09-16
  • [Presentation] 重複音を含む環境音データベースにおける環境音検出のための特徴量の基本検討2016

    • Author(s)
      原直, 田中智康, 阿部匡伸
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      富山大学五福キャンパス(富山県富山市)
    • Year and Date
      2016-09-14 – 2016-09-16
  • [Presentation] RNNによる実環境データからのマルチ音響イベント検出2016

    • Author(s)
      鳥羽隼司, 原直, 阿部匡伸
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      富山大学五福キャンパス(富山県富山市)
    • Year and Date
      2016-09-14 – 2016-09-16
  • [Remarks] w3voice Laboratory

    • URL

      https://w3voice.jp/

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi