研究課題/領域番号 |
15K01069
|
研究機関 | 和歌山大学 |
研究代表者 |
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
|
研究分担者 |
原 直 岡山大学, 自然科学研究科, 助教 (50402467)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 音声情報処理 / 教育現場 / 可視化 / 笑い声 / 環境音 |
研究実績の概要 |
本研究では「音」の可視化を技術基盤とし、学生のアクティビティ測定法を提案する。提案法を大学等の高等教育機関で導入が進むPBL(Project-Based Learning)の教育現場で試行することを目指す。 既存の音声認識プログラムでは、実環境下の議論、くだけたスタイルの会話や複雑に入り組んだ対話すべてを正確に書き起こすことは困難である。まずは、会話の活性度を示す重要なファクターは「笑い声」であると仮定して検討を進めている。グループワークの中で発生する笑い声を検出し、その頻度からアクティビティを可視化する。 模擬グループ対話で音声信号の収集を行った。設置機器が本来の作業や対話を妨げることが無いようにするため、プロトタイプシステムを小型ボードコンピュータで実装した。本システムには小型マイクを接続している。また、LEDの点灯によって、対話参加者に笑い声を検出したことを知らせる機能を有する。 収録データを聴取し、1,462個の発話区間(笑い声の有無に関わらず)を確認した。このうち、プロトタイプシステムでは、笑い声として検出した 800個のうち、実際に笑い声であった適合率は51.3%であった。収録データを用いてモデルを再構築したところ、適合率が73.7%となり、性能向上を確認した。 また、認識アルゴリズムの開発としては、実環境収録の環境音を利用して、10クラスの識別実験を行った。GMM-UBMによる識別器では、最も高いクラスで73%の精度が得られた。識別性能としてはそれほど高いとは言えないが、GMMを用いることで尤度計算ができるようになった。10秒間の環境音を聴取した時の主観的な印象を聞き取り調査したところ、GMMの尤度を用いた尤度比が主観的な印象に基づく音の含有割合に近い結果を得た。この結果から、陽に音を分類しない統計的な特徴のみに基づいた可視化の可能性が示唆された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初予定していたように活動音を収録するための小型デバイスを実装し、今後の研究に必要な音声信号を収集することができた。 既存の音声認識をベースとした技術では、活動音をすべて可視化することは困難であることが予想されたが、「笑い声」に対象をしぼることによって、具体的な方針を導くことができた。 前述のように認識アルゴリズムに関する要素技術の開発においては一定の成果を得ている。並行して、パラメータの抽象化や可視化に向けての基礎的な検討を行うことができた。 以上のように、次年度以降の研究に問題なく取り組める状況にあることから、本研究は、おおむね順調に進展していると考える。
|
今後の研究の推進方策 |
PBL学修者のアクティビティを視覚的に把握できるようにするために、パラメタの可視化技術を検討する。数値の抽象化に加え、認識結果に対応する音源の種類や意味情報の付与、位置や時間情報とのマッピングの手法について開発する。 平成27年度に開発したデバイスは、安価なハードウェアで構成した。これはグループワークの際に、録音機器を分散配置し、学修者の活動に伴う音響信号を取得する目的に適している。この機器に接続するマイクロホンの音響特性には、個体差が存在する。提案法では、取得データに抽象化処理を加えることで、個体差を吸収する枠組みが備わっている。同時に、本研究では、開発デバイスの音響特性を考慮し、ハード的な個体差を吸収する技術開発を検討する。 学生に協力を得て、グループワークを含む模擬PBL授業を実施し、研究に必要なデータを収集する。この際、開発デバイスを用いて音響信号を集音するとともに、ビデオカメラを用いて映像も記録する。また、収集データを人手で確認し、必要なメタデータを付与し、研究の基礎的資料とする。
|
次年度使用額が生じた理由 |
アルゴリズムの変更により、収集データから統計量を学習する際に必要となると予想していた教師ラベル情報の付与作業が不要となり、研究協力謝金の支出を抑えることができた。 高い演算性能を有するGPU(グラフィックプロセッシングユニット)が広く普及し、GPU搭載のLinuxワークステーションを中心にハードウェアの購入費用を安価に抑えることができた。
|
次年度使用額の使用計画 |
可視化技術を高度化するためには、単純な教師ラベルとは異なるメタ情報を収集データに付与する作業が必要となるため、人件費として支出する。 今後の研究を滞りなく進めるためには、高速演算能力を有する計算機を増強する必要があるため、物品費を増補する。
|