• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

PBLの個人評価を目的とする活動音の可視化技術

Research Project

Project/Area Number 15K01069
Research InstitutionWakayama University

Principal Investigator

西村 竜一  和歌山大学, システム工学部, 助教 (00379611)

Co-Investigator(Kenkyū-buntansha) 原 直  岡山大学, 自然科学研究科, 助教 (50402467)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords音声情報処理 / 教育現場 / 可視化 / 笑い声 / 環境音
Outline of Annual Research Achievements

本研究では「音」の可視化を技術基盤とし、学生のアクティビティ測定法を提案する。提案法を大学等の高等教育機関で導入が進むPBL(Project-Based Learning)の教育現場で試行することを目指す。
既存の音声認識プログラムでは、実環境下の議論、くだけたスタイルの会話や複雑に入り組んだ対話すべてを正確に書き起こすことは困難である。まずは、会話の活性度を示す重要なファクターは「笑い声」であると仮定して検討を進めている。グループワークの中で発生する笑い声を検出し、その頻度からアクティビティを可視化する。
模擬グループ対話で音声信号の収集を行った。設置機器が本来の作業や対話を妨げることが無いようにするため、プロトタイプシステムを小型ボードコンピュータで実装した。本システムには小型マイクを接続している。また、LEDの点灯によって、対話参加者に笑い声を検出したことを知らせる機能を有する。
収録データを聴取し、1,462個の発話区間(笑い声の有無に関わらず)を確認した。このうち、プロトタイプシステムでは、笑い声として検出した 800個のうち、実際に笑い声であった適合率は51.3%であった。収録データを用いてモデルを再構築したところ、適合率が73.7%となり、性能向上を確認した。
また、認識アルゴリズムの開発としては、実環境収録の環境音を利用して、10クラスの識別実験を行った。GMM-UBMによる識別器では、最も高いクラスで73%の精度が得られた。識別性能としてはそれほど高いとは言えないが、GMMを用いることで尤度計算ができるようになった。10秒間の環境音を聴取した時の主観的な印象を聞き取り調査したところ、GMMの尤度を用いた尤度比が主観的な印象に基づく音の含有割合に近い結果を得た。この結果から、陽に音を分類しない統計的な特徴のみに基づいた可視化の可能性が示唆された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初予定していたように活動音を収録するための小型デバイスを実装し、今後の研究に必要な音声信号を収集することができた。
既存の音声認識をベースとした技術では、活動音をすべて可視化することは困難であることが予想されたが、「笑い声」に対象をしぼることによって、具体的な方針を導くことができた。
前述のように認識アルゴリズムに関する要素技術の開発においては一定の成果を得ている。並行して、パラメータの抽象化や可視化に向けての基礎的な検討を行うことができた。
以上のように、次年度以降の研究に問題なく取り組める状況にあることから、本研究は、おおむね順調に進展していると考える。

Strategy for Future Research Activity

PBL学修者のアクティビティを視覚的に把握できるようにするために、パラメタの可視化技術を検討する。数値の抽象化に加え、認識結果に対応する音源の種類や意味情報の付与、位置や時間情報とのマッピングの手法について開発する。
平成27年度に開発したデバイスは、安価なハードウェアで構成した。これはグループワークの際に、録音機器を分散配置し、学修者の活動に伴う音響信号を取得する目的に適している。この機器に接続するマイクロホンの音響特性には、個体差が存在する。提案法では、取得データに抽象化処理を加えることで、個体差を吸収する枠組みが備わっている。同時に、本研究では、開発デバイスの音響特性を考慮し、ハード的な個体差を吸収する技術開発を検討する。
学生に協力を得て、グループワークを含む模擬PBL授業を実施し、研究に必要なデータを収集する。この際、開発デバイスを用いて音響信号を集音するとともに、ビデオカメラを用いて映像も記録する。また、収集データを人手で確認し、必要なメタデータを付与し、研究の基礎的資料とする。

Causes of Carryover

アルゴリズムの変更により、収集データから統計量を学習する際に必要となると予想していた教師ラベル情報の付与作業が不要となり、研究協力謝金の支出を抑えることができた。
高い演算性能を有するGPU(グラフィックプロセッシングユニット)が広く普及し、GPU搭載のLinuxワークステーションを中心にハードウェアの購入費用を安価に抑えることができた。

Expenditure Plan for Carryover Budget

可視化技術を高度化するためには、単純な教師ラベルとは異なるメタ情報を収集データに付与する作業が必要となるため、人件費として支出する。
今後の研究を滞りなく進めるためには、高速演算能力を有する計算機を増強する必要があるため、物品費を増補する。

  • Research Products

    (6 results)

All 2016 2015 Other

All Presentation (5 results) Remarks (1 results)

  • [Presentation] ウェブ試験向け音声入力UI設計における不要語の扱いについて2016

    • Author(s)
      西村竜一, 牧野さやか, 入野 俊夫
    • Organizer
      日本音響学会2016年春季研究発表会
    • Place of Presentation
      桐蔭横浜大学
    • Year and Date
      2016-03-09 – 2016-03-11
  • [Presentation] クリエプロジェクト: 和歌山大学協働教育センターによる人材育成2015

    • Author(s)
      西村竜一, 木村亮介, 寺本東吾, 吉田庄吾, 谷脇すずみ, 中島敦司, 石塚亙
    • Organizer
      ものづくり・創造性教育施設ネットワーク第13回シンポジウム
    • Place of Presentation
      山口大学工学部
    • Year and Date
      2015-12-11 – 2015-12-11
  • [Presentation] 環境音検出器を用いた環境音の可視化に関する検討2015

    • Author(s)
      田中智康, 原直, 阿部匡伸
    • Organizer
      第17回IEEE広島支部学生シンポジウム(HISS 17th)
    • Place of Presentation
      岡山大学
    • Year and Date
      2015-11-21 – 2015-11-22
  • [Presentation] RaspberryPiを用いた笑い声検知システムの提案2015

    • Author(s)
      三上菜穂, 西村竜一, 入野俊夫
    • Organizer
      日本音響学会2015年秋季研究発表会
    • Place of Presentation
      会津大学
    • Year and Date
      2015-09-16 – 2015-09-18
  • [Presentation] 大人・子ども話者識別システムにおける性能改善の検討2015

    • Author(s)
      西村竜一, 入野俊夫, 河原英紀
    • Organizer
      日本音響学会2015年秋季研究発表会
    • Place of Presentation
      会津大学
    • Year and Date
      2015-09-16 – 2015-09-18
  • [Remarks] w3voice Laboratory

    • URL

      https://w3voice.jp/

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi