2017 Fiscal Year Annual Research Report

Studies of utilization of lecture speeches recorded in various environments for learning/educational support

Research Project

Project/Area Number	15K00254
Research Institution	Kyoto University
Principal Investigator	南條浩輝京都大学, 学術情報メディアセンター, 准教授 (50388162)
Co-Investigator(Kenkyū-buntansha)	西崎博光山梨大学, 大学院総合研究部, 准教授 (40362082) 高橋徹大阪産業大学, デザイン工学部, 准教授 (30419494)
Project Period (FY)	2015-04-01 – 2018-03-31
Keywords	音声言語情報処理 / 学習支援 / 教育支援 / 授業音声の利活用
Outline of Annual Research Achievements	「録音環境が整えられている教室」に限らない、多様な録音環境を対象とした、汎用的な授業音声の再利用（教育・学習支援）の基盤形成をめざし研究を推進した。以下に内容をまとめる。 - 授業音声の分析・明瞭化: 授業音声の回復、または、音声言語処理を適用しやすい音声への変換技術について研究を進めた。既存の雑音残響抑圧技術の適用可能性と問題点を検討し、音声の回復では、信号の歪と量子化ビット数の両方が重要であることを確認した。複数話者が存在する授業音声を扱う際の知見として活用をするべく、複数名が同時発話する環境での自由発話の傾向を調査し、音響特徴を調べた。また、音声圧縮技術による明瞭化も検討した。H29年度はモノラル録音された授業音声の明瞭化のため、教師発話の分離手法を研究した。具体的には非負値行列分解法の拡張、すなわち音声スペクトルモデルに特化した基底ベクトルを獲得可能な方式への拡張をおこなった。 - 多様な環境の授業を指向した音声認識: はじめに小学校授業音声をそのまま認識し、次に音響モデル学習と多様な録音環境での収録音声の活用を視野に入れ、授業音声コーパスに様々な音声圧縮を適用し、それらの扱いについて研究を推進した。さらに、音声認識誤り訂正手法を研究をした。H29年度は、H28年度から引き続き、深層学習とデータ圧縮技術による擬似多様環境音声の作成とそれを用いた音声認識の研究を推進した。これは、音声認識システム構築において高コストである多様な環境での大量音声収集・整備の代用・補完技術と位置付けることができ、意義深い。また、授業で使える電子ノートシステムの開発とその効果を確認した。 - 授業音声の再利用のための基盤技術: 期間全体を通じて、アーカイブした授業データを効率よく検索するための技術（音声ドキュメント検索）の研究を推進し、検索性能の改善を得た。

Research Products
(12 results)

All 2018 2017

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (10 results) (of which Int'l Joint Research: 2 results) Book (1 results)

[Journal Article] 音声検索語検出のためのクエリ拡張の検討2017
- Author(s)
  南條浩輝, 前田翔, 吉見毅彦
- Journal Title
  
  情報処理学会論文誌
  
  Volume: vol.58, No.10 Pages: 1735-1744
- Peer Reviewed
[Presentation] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018
- Author(s)
  丹治遥，小嶋和徳，李時旭，南條浩輝，伊藤慶明
- Organizer
  日本音響学会春季研究発表会講演論文集
[Presentation] 複数スペクトルモデルの混合表現可能なNMFに基づく音声スペクトル強調2018
- Author(s)
  高橋徹
- Organizer
  日本音響学会春季研究発表会講演論文集
[Presentation] 複数言語を同時に扱える音声認識のための音響モデリングの検討2018
- Author(s)
  原翔吾，西崎博光
- Organizer
  日本音響学会春季研究発表会講演論文集
[Presentation] 録音環境に頑健な授業音声認識のための音声コーデックとその活用の検討2017
- Author(s)
  南條浩輝, 西崎博光, 高橋徹
- Organizer
  情報処理学会研究報告MUS-115-54
[Presentation] 人狼プレイ録音音声のNMFベース任意話者音声強調2017
- Author(s)
  河野秀祐, 高橋徹
- Organizer
  電子情報通信学会技術研究報告SP2017-35
[Presentation] 教師発話から学習した音響特徴を用いた授業音声の発話強調2017
- Author(s)
  高橋徹, 南條浩輝, 西崎博光
- Organizer
  日本音響学会秋季研究発表会講演論文集
[Presentation] Data augmentation and feature extraction using variational autoencoder for acoustic modeling2017
- Author(s)
  Hiromitsu Nishizaki
- Organizer
  The 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
- Int'l Joint Research
[Presentation] Usability and Learning Effect Evaluations of an Electrical Note-Taking Support System with Speech Processing Technologies2017
- Author(s)
  Hiromitsu Nishizaki, Yosuke Narita
- Organizer
  The 25th International Conference on Computers in Education
- Int'l Joint Research
[Presentation] 複数認識システムの重要度を用いた正解音素推定器に基づく音声中の検索語検出の検討2017
- Author(s)
  澤田直輝，西崎博光
- Organizer
  日本音響学会秋季研究発表会講演論文集
[Presentation] 音声コーデックと変分オートエンコーダを利用した音響モデル学習データの拡張2017
- Author(s)
  西崎博光，南條浩輝，高橋徹
- Organizer
  日本音響学会秋季研究発表会講演論文集
[Book] 算数＆ラズパイから始めるディープ・ラーニング2018
- Author(s)
  牧野浩二，西崎博光
- Total Pages
  208
- Publisher
  CQ出版社

2017 Fiscal Year Annual Research Report

Studies of utilization of lecture speeches recorded in various environments for learning/educational support

Principal Investigator

南條 浩輝 京都大学, 学術情報メディアセンター, 准教授 (50388162)

Research Products

[Journal Article] 音声検索語検出のためのクエリ拡張の検討2017

Author(s)

Journal Title

[Presentation] 音声中の検索語検出における最上位候補を含む講演及びその類似講演優先方式2018

Author(s)

Organizer

[Presentation] 複数スペクトルモデルの混合表現可能なNMFに基づく音声スペクトル強調2018

Author(s)

Organizer

[Presentation] 複数言語を同時に扱える音声認識のための音響モデリングの検討2018

Author(s)

Organizer

[Presentation] 録音環境に頑健な授業音声認識のための音声コーデックとその活用の検討2017

Author(s)

Organizer

[Presentation] 人狼プレイ録音音声のNMFベース任意話者音声強調2017

Author(s)

Organizer

[Presentation] 教師発話から学習した音響特徴を用いた授業音声の発話強調2017

Author(s)

Organizer

[Presentation] Data augmentation and feature extraction using variational autoencoder for acoustic modeling2017

Author(s)

Organizer

[Presentation] Usability and Learning Effect Evaluations of an Electrical Note-Taking Support System with Speech Processing Technologies2017

Author(s)

Organizer

[Presentation] 複数認識システムの重要度を用いた正解音素推定器に基づく音声中の検索語検出の検討2017

Author(s)

Organizer

[Presentation] 音声コーデックと変分オートエンコーダを利用した音響モデル学習データの拡張2017

Author(s)

Organizer

[Book] 算数＆ラズパイから始めるディープ・ラーニング2018

Author(s)

Total Pages

Publisher

南條浩輝京都大学, 学術情報メディアセンター, 准教授 (50388162)