• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

プレゼンテーションスキルの向上を支援する模範音声の自動生成システム

Research Project

Project/Area Number 18K18170
Research InstitutionAnan National College of Technology

Principal Investigator

太田 健吾 (太田健吾)  阿南工業高等専門学校, 創造技術工学科, 講師 (80712801)

Project Period (FY) 2018-04-01 – 2021-03-31
Keywords音声言語処理 / 自然言語処理 / 発表音声 / プレゼンテーションスキル / 話し方評価
Outline of Annual Research Achievements

本研究課題では、人工知能の一分野である音声言語処理の技術を用いて、発表者にとって模範となる理想的な発表音声を自動生成することにより、発表の効果的な自主練習を支援するシステムの構築を目指している。平成30年度は、以下の2つの研究について取り組んだ。
【実施内容1】「えっとー」「あのー」などの間投詞や言い淀みといった冗長表現を発表音声から自動検出するアルゴリズムの研究開発を行った。具体的には、日本語話し言葉コーパスに含まれる講演音声を学習データとして、音声から抽出された音響的な特徴量(基本周波数やゼロ交差率、およびそれらの統計量など)に基づいて冗長表現を検出する検出器を、深層学習の手法の中でも特に時系列データの扱いに有効なLong short-term memory (LSTM)ネットワークによって学習した。評価実験を行った結果、標準的な機械学習を用いた検出器よりも高い検出精度を達成することができた。今後は、音響的な特徴量だけでなく、言語的な特徴量も併用することで、さらに検出精度の改善を目指したい。
【実施内容2】発表音声に含まれる用法の不適切な語彙や、難解で理解しにくい語句を、より平易かつ適切な語句に変換するアルゴリズムの研究開発も行った。具体的には、やさしい日本語コーパスに含まれる日本語の言い換えペアを学習データとして、入力された文中の語句を平易に言い換える変換器を、深層学習の手法の一つである注意機構付きLSTMによるエンコーダ・デコーダモデルを用いて学習した。これにより、一部の語句について、よりわかりやすい語句に変換を行えることが確認できた。今後は、より多くの学習データを用いることにより、さらに変換精度の改善を目指したい。
【実施内容3】本研究課題の提案するシステムの概要、および前述の研究成果について、国内の学会で発表を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題では、提案するシステムを実現するために、4つの要素技術の研究開発を行うことを計画している。初年度である平成30年度では、これら4つのうち、2つの要素技術について研究開発を行い、一定の実績が得られたため、おおむね順調に進展していると判断する。

Strategy for Future Research Activity

平成31年度は、以下の研究内容を実施する。
【実施内容1】平成30年度に研究開発を行った、冗長表現の自動検出アルゴリズムをさらに改良する。具体的には、音響的な特徴量だけでなく、言語的な特徴量も併用することで、検出の高精度化を図る。特に、発表音声の書き起こしデータあるいは音声認識結果の文字列や単語列を、分散表現ベクトルに変換して用いることで、語句の意味を考慮した検出アルゴリズムに拡張する。開発したアルゴリズムは、講演音声あるいは発表音声を対象とした評価実験により評価を行う。
【実施内容2】平成30年度に研究開発を行った、語句の言い換えアルゴリズムをさらに改良する。具体的には、より多くの学習データを用いることにより、入力文の文構造を維持しながら、高精度に言い換えを行うアルゴリズムの実現を目指す。開発したアルゴリズムは、講演音声あるいは発表音声を対象とした評価実験により評価を行う。
【実施内容3】語彙だけでなく、文構造や係り受けといった構文レベルの言い換えを行うアルゴリズムについて研究開発を開始する。このような言い換えを行うためには、統計的機械翻訳の技術を応用し、入力された発話中のフレーズを、耳で聞いて理解しやすい順番に並べ替える必要がある。そこで、文法規則に基づく言語的な区切りと、話し言葉特有の間の置き方や息継ぎタイミングに基づく音響的な区切りを同時に考慮するような並び替えモデルを構築する。
【実施内容4】研究開発を行った各要素技術について、国内外の音声言語処理・自然言語処理に関する学会で発表を行う。

Causes of Carryover

物品費については、物品の価格にわずかな変動があったため、少額の繰越額が発生した。
旅費については、当初の予定とは異なる学会で発表を行ったため、少額の繰越額が発生した。
それぞれ本年度の物品費および旅費として活用する。

  • Research Products

    (1 results)

All 2019

All Presentation (1 results)

  • [Presentation] プレゼンテーションスキルの向上を支援する模範音声の自動生成システム2019

    • Author(s)
      19)太田健吾,市原大和,増田晃平,元木洋志
    • Organizer
      電子情報通信学会総合大会

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi