• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

学習・教育支援のための多様な環境で収録された授業音声の利活用に関する研究

Research Project

Project/Area Number 15K00254
Research InstitutionKyoto University

Principal Investigator

南條 浩輝  京都大学, 学術情報メディアセンター, 准教授 (50388162)

Co-Investigator(Kenkyū-buntansha) 西崎 博光  山梨大学, 総合研究部, 准教授 (40362082)
高橋 徹  大阪産業大学, デザイン工学部, 准教授 (30419494)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords音声言語情報処理 / 学習支援 / 教育支援 / 授業音声の利活用
Outline of Annual Research Achievements

音声言語処理を用いた教育支援の研究を推進している。「十分な録音環境が整えられている教室」での授業に限らない多様な環境での授業を想定し、汎用的な授業音声の再利用(教育・学習支援)の基盤形成をめざして研究を推進している。平成28年度は、具体的には以下を推進した。
- 授業音声の明瞭化: 授業音声の回復、または、音声言語処理を適用しやすい音声への変換技術について研究を進めた。音声の回復では、信号の歪と量子化ビット数の両方が重要であることを確認した。さらに、多様な録音環境(音声コーデック、ビットレート)の音声の認識について研究を推進した。これらは多様な環境で収録された音声を標準化する試みであり、その後の再利用過程において意義が大きい。
- 音声の分析: 複数名が同時発話する環境での自由発話の傾向を調査し、読み上げと異なる音響特徴の出現を確認できた。ディスカッションや英会話など、複数の話者が存在する授業音声を扱う際の知見として活用を期待している。
- 授業音声の再利用化システムのための基盤技術: 授業音声の音声認識、音声の検索のための技術の研究を推進した。音声認識では、音響モデル学習と多様な録音環境での収録音声の活用を視野に入れ、授業音声コーパスに様々な音声圧縮を適用し、それらの扱いについて研究を推進した。さらに、音声認識における認識誤りを訂正する手法を開発した。音声の検索技術では、キーワードの検出・検索技術に焦点をあてて研究を推進した。本技術の共通評価基盤の整備についてもNTCIR-12プロジェクトにオーガナイザとして参加することで推進した。さらに、授業で利用する電子ノート作成支援システムを開発し、これを用いることで学習効果が高まることを評価実験で示した。これらは授業音声の再利用のための基盤形成にとって意義深い。
- 情報収集と成果報告: 関連研究の調査と成果報告を加速した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

授業音声の利活用のための諸技術について研究を推進できている。
収録環境が異なっても頑健に認識できるための音響モデルやその学習のための学習データの利活用について進展があった。さらに、音声認識誤り訂正手法によって音声認識率を改善できたり、音声データの検索精度の改善が見られた。また、授業録音音声の明瞭化において当初重要と考えていた信号の歪に加えて、録音における実際の量子化ビット数の違いが、信号回復処理に影響することが分かりつつある。歪の回復に加え、極端に少ないビット数での量子化によって失われた情報を回復する必要性を確認できた。研究によって新たな課題が見つかり、その対応方法も研究対象に入れ検討できている。
以上より、おおむね順調に進展していると判断している。

Strategy for Future Research Activity

・授業音声コーパスの拡充とアノテーションを可能な限り推進
・授業音声の明瞭化技術、明確化された音声の音声認識のための諸技術の研究を推進
・授業音声コーパスのコンテンツ化のための音声の検索技術の研究を進展

Causes of Carryover

既存の研究環境を活用した。論文投稿にかかる費用支出が次年度以降となった。

Expenditure Plan for Carryover Budget

次の目的に使用していきたい。①授業音声コーパス整備、②GPU搭載高性能計算機の導入とそれによる研究推進、③研究成果の積極的な公開

  • Research Products

    (13 results)

All 2017 2016

All Journal Article (4 results) (of which Peer Reviewed: 4 results,  Acknowledgement Compliant: 4 results) Presentation (8 results) (of which Int'l Joint Research: 2 results) Book (1 results)

  • [Journal Article] 音声ドキュメントを検索対象とした用語検索2017

    • Author(s)
      森田直樹,南條浩輝,山本凌紀,馬青
    • Journal Title

      情報処理学会論文誌(テクニカルノート)

      Volume: Vol.58, No.3 Pages: Vol.58, No.3

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] テレビ番組音声の自発的発話音声コーパスとしての活用可能性について2017

    • Author(s)
      高橋徹,赤塚俊洋
    • Journal Title

      大阪産業大学学会論文集,自然科学

      Volume: 128 Pages: 印刷中

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Re-Ranking Approach of Spoken Term Detection using Conditional Random Fields-based Trephine Detection2016

    • Author(s)
      Naoki Sawada, Hiromitsu Nishizaki
    • Journal Title

      IEICE Trans. on Information & Systems

      Volume: Vol.E99-D, No.10 Pages: 2518-2527

    • DOI

      10.1587/transinf.2016SLP0012

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Spoken Term Detection using SVM-based Classifier Trained with Pre-indexed Keywords2016

    • Author(s)
      Kentaro Domoto, Takehito Utsuro, Naoki Sawada, Hiromitsu Nishizaki
    • Journal Title

      IEICE Trans. on Information & Systems

      Volume: Vol.E99-D, No.10 Pages: 2528-2538

    • DOI

      10.1587/transinf.2016SLP0017

    • Peer Reviewed / Acknowledgement Compliant
  • [Presentation] 電子ノート作成支援システムの利用が及ぼす学習効果の検証2017

    • Author(s)
      成田陽介,西崎博光
    • Organizer
      情報処理学会第79回全国大会
    • Place of Presentation
      名古屋大学(愛知県名古屋市)
    • Year and Date
      2017-03-16 – 2017-03-18
  • [Presentation] 音声中の検索語検出のための双方向回帰結合ニューラルネットワークを用いた正解音素推定2017

    • Author(s)
      澤田直輝,西崎博光
    • Organizer
      日本音響学会2017年春季研究発表会
    • Place of Presentation
      明治大学(神奈川県川崎市)
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 定常雑音下でのAD変換における量子化ビット数とSNR の関係2017

    • Author(s)
      高橋徹
    • Organizer
      日本音響学会2017年春季研究発表会
    • Place of Presentation
      明治大学(神奈川県川崎市)
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 検索語説明文を利用した音声検索語検出の検討2017

    • Author(s)
      南條浩輝,川口達也
    • Organizer
      日本音響学会2017年春季研究発表会
    • Place of Presentation
      明治大学(神奈川県川崎市)
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 複数の入力説明文を用いた音声ドキュメントからの用語検索2017

    • Author(s)
      森田直樹,南條浩輝,馬青
    • Organizer
      言語処理学会第23回年次大会
    • Place of Presentation
      筑波大学(茨城県つくば市)
    • Year and Date
      2017-03-14 – 2017-03-16
  • [Presentation] 検索語の説明文による音声内容検索を利用した音声検索語検出2017

    • Author(s)
      南條浩輝,川口達也
    • Organizer
      情報処理学会音声言語情報処理研究会SIG-SLP
    • Place of Presentation
      琴平グランドホテル桜の抄(香川県仲多度郡琴平町)
    • Year and Date
      2017-02-17 – 2017-02-18
  • [Presentation] Recurrent Neural Network-based Phoneme Sequence Estimation using Multiple ASR Systems' Outputs for Spoken Term Detection2016

    • Author(s)
      Naoki Sawada, Hiromitsu Nishizaki
    • Organizer
      INTERSPEECH 2016
    • Place of Presentation
      SAN FRANCISCO, USA
    • Year and Date
      2016-09-08 – 2016-09-12
    • Int'l Joint Research
  • [Presentation] Overview of the NTCIR-12 SpokenQuery&Doc-2 Task2016

    • Author(s)
      Tomoyosi Akiba, Hiromitsu Nishizaki, Hiroaki Nanjo and Gareth J. F. Jones
    • Organizer
      12th NTCIR Conference on Evaluation of Information Access Technologies
    • Place of Presentation
      TOKYO, JAPAN
    • Year and Date
      2016-06-07 – 2016-06-10
    • Int'l Joint Research
  • [Book] インタフェース 2017年3月号2017

    • Author(s)
      牧野浩二,西崎博光
    • Total Pages
      -
    • Publisher
      CQ出版社

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi