• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実績報告書

学習・教育支援のための多様な環境で収録された授業音声の利活用に関する研究

研究課題

研究課題/領域番号 15K00254
研究機関京都大学

研究代表者

南條 浩輝  京都大学, 学術情報メディアセンター, 准教授 (50388162)

研究分担者 西崎 博光  山梨大学, 大学院総合研究部, 准教授 (40362082)
高橋 徹  大阪産業大学, デザイン工学部, 准教授 (30419494)
研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード音声言語情報処理 / 学習支援 / 教育支援 / 授業音声の利活用
研究実績の概要

「録音環境が整えられている教室」に限らない、多様な録音環境を対象とした、汎用的な授業音声の再利用(教育・学習支援)の基盤形成をめざし研究を推進した。以下に内容をまとめる。
- 授業音声の分析・明瞭化: 授業音声の回復、または、音声言語処理を適用しやすい音声への変換技術について研究を進めた。既存の雑音残響抑圧技術の適用可能性と問題点を検討し、音声の回復では、信号の歪と量子化ビット数の両方が重要であることを確認した。複数話者が存在する授業音声を扱う際の知見として活用をするべく、複数名が同時発話する環境での自由発話の傾向を調査し、音響特徴を調べた。また、音声圧縮技術による明瞭化も検討した。H29年度はモノラル録音された授業音声の明瞭化のため、教師発話の分離手法を研究した。具体的には非負値行列分解法の拡張、すなわち音声スペクトルモデルに特化した基底ベクトルを獲得可能な方式への拡張をおこなった。
- 多様な環境の授業を指向した音声認識: はじめに小学校授業音声をそのまま認識し、次に音響モデル学習と多様な録音環境での収録音声の活用を視野に入れ、授業音声コーパスに様々な音声圧縮を適用し、それらの扱いについて研究を推進した。さらに、音声認識誤り訂正手法を研究をした。H29年度は、H28年度から引き続き、深層学習とデータ圧縮技術による擬似多様環境音声の作成とそれを用いた音声認識の研究を推進した。これは、音声認識システム構築において高コストである多様な環境での大量音声収集・整備の代用・補完技術と位置付けることができ、意義深い。また、授業で使える電子ノートシステムの開発とその効果を確認した。
- 授業音声の再利用のための基盤技術: 期間全体を通じて、アーカイブした授業データを効率よく検索するための技術(音声ドキュメント検索)の研究を推進し、検索性能の改善を得た。

  • 研究成果

    (12件)

すべて 2018 2017

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (10件) (うち国際学会 2件) 図書 (1件)

  • [雑誌論文] 音声検索語検出のためのクエリ拡張の検討2017

    • 著者名/発表者名
      南條浩輝, 前田翔, 吉見毅彦
    • 雑誌名

      情報処理学会論文誌

      巻: vol.58, No.10 ページ: 1735-1744

    • 査読あり
  • [学会発表] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018

    • 著者名/発表者名
      丹治遥,小嶋和徳,李時旭,南條浩輝,伊藤慶明
    • 学会等名
      日本音響学会春季研究発表会講演論文集
  • [学会発表] 複数スペクトルモデルの混合表現可能なNMFに基づく音声スペクトル強調2018

    • 著者名/発表者名
      高橋徹
    • 学会等名
      日本音響学会春季研究発表会講演論文集
  • [学会発表] 複数言語を同時に扱える音声認識のための音響モデリングの検討2018

    • 著者名/発表者名
      原翔吾,西崎博光
    • 学会等名
      日本音響学会春季研究発表会講演論文集
  • [学会発表] 録音環境に頑健な授業音声認識のための音声コーデックとその活用の検討2017

    • 著者名/発表者名
      南條浩輝, 西崎博光, 高橋徹
    • 学会等名
      情報処理学会研究報告MUS-115-54
  • [学会発表] 人狼プレイ録音音声のNMFベース任意話者音声強調2017

    • 著者名/発表者名
      河野秀祐, 高橋徹
    • 学会等名
      電子情報通信学会技術研究報告SP2017-35
  • [学会発表] 教師発話から学習した音響特徴を用いた授業音声の発話強調2017

    • 著者名/発表者名
      高橋徹, 南條浩輝, 西崎博光
    • 学会等名
      日本音響学会秋季研究発表会講演論文集
  • [学会発表] Data augmentation and feature extraction using variational autoencoder for acoustic modeling2017

    • 著者名/発表者名
      Hiromitsu Nishizaki
    • 学会等名
      The 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
    • 国際学会
  • [学会発表] Usability and Learning Effect Evaluations of an Electrical Note-Taking Support System with Speech Processing Technologies2017

    • 著者名/発表者名
      Hiromitsu Nishizaki, Yosuke Narita
    • 学会等名
      The 25th International Conference on Computers in Education
    • 国際学会
  • [学会発表] 複数認識システムの重要度を用いた正解音素推定器に基づく音声中の検索語検出の検討2017

    • 著者名/発表者名
      澤田直輝,西崎博光
    • 学会等名
      日本音響学会秋季研究発表会講演論文集
  • [学会発表] 音声コーデックと変分オートエンコーダを利用した音響モデル学習データの拡張2017

    • 著者名/発表者名
      西崎博光,南條浩輝,高橋徹
    • 学会等名
      日本音響学会秋季研究発表会講演論文集
  • [図書] 算数&ラズパイから始めるディープ・ラーニング2018

    • 著者名/発表者名
      牧野浩二,西崎博光
    • 総ページ数
      208
    • 出版者
      CQ出版社

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi