• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Automatic generation system for exemplary presentation speech to improve presentation skills

Research Project

Project/Area Number 18K18170
Research InstitutionAnan National College of Technology

Principal Investigator

太田 健吾  阿南工業高等専門学校, 創造技術工学科, 准教授 (80712801)

Project Period (FY) 2018-04-01 – 2022-03-31
Keywords音声言語処理 / 自然言語処理 / 発表音声 / プレゼンテーションスキル / 音声合成 / 音声認識
Outline of Annual Research Achievements

本研究課題では、人工知能の一分野である音声言語処理の技術を用いて、発表者にとって模範となる理想的な発表音声を自動生成することにより、発表の効果的な自主練習を支援するシステムの構築を目指している最終年度である2021年度は、以下の項目に取り組んだ。
【項目1】模範音声を生成するために、発表音声と同じ声質の自然な合成音声を生成する手法について検討した。具体的には、これまでに提案した、日本語のアクセントの特徴を考慮した音声合成手法を拡張し、合成音声の話者性を制御可能な音声合成モデルを構築する手法について検討した。複数の話者を含む音声言語データベースから学習された、話者の特徴を表す埋め込み表現を利用し、この埋め込み表現に基づく話者ベクトルの線形演算により、多様な声質の合成音声を実現できる可能性を示した。
【項目2】これまでに構築してきたシステムの要素技術である冗長表現の自動検出・除去や語彙の最適化モデルをさらに高精度化するために、これらの入力となる音声認識結果の精度改善に取り組んだ。具体的には、発表音声に含まれる話し言葉特有の問題(フィラーや言い淀み)を考慮したEnd-to-End音声認識モデルを学習するために、こうした非流暢的音響特徴に対応する書き起こし箇所をラベルに置き換える手法を提案した。また、発表音声に含まれる特定の話題に関連した単語や言い回しを高精度に認識するために、Density Ratio Approachの考え方を応用して、特定のドメインに特化した学習データを音声認識モデルの学習において効果的に利用する手法を提案した。

  • Research Products

    (11 results)

All 2022 2021

All Presentation (11 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] タスク外音響情報を付加したEnd-to-End音声認識モデルの設計2022

    • Author(s)
      森 大輝,太田 健吾,西村 良太,小川厚徳,北岡 教英
    • Organizer
      日本音響学会春季講演論文集,2-3Q-2
  • [Presentation] 非流暢ラベルを用いた言い淀み整形End-to-End音声認識2022

    • Author(s)
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,小川厚徳,北岡 教英
    • Organizer
      日本音響学会春季講演論文集,1-3-5
  • [Presentation] 話者ベクトルの線形演算に基づく仮想エージェント用音声合成2021

    • Author(s)
      松田 美海,太田 健吾
    • Organizer
      計測自動制御学会四国支部学術講演会論文集,PS1-09
  • [Presentation] 言い淀みを考慮したEnd-to-End音声認識2021

    • Author(s)
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
    • Organizer
      第19回情報学ワークショップ(WiNF2021),S-5-2
  • [Presentation] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021

    • Author(s)
      森 大輝,太田 健吾,西村 良太,北岡 教英
    • Organizer
      第19回情報学ワークショップ(WiNF2021),S-5-5
  • [Presentation] Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法2021

    • Author(s)
      森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英
    • Organizer
      日本音響学会秋季講演論文集,1-3-1
  • [Presentation] 言い淀みを考慮した自由発話のEnd-to-End音声認識2021

    • Author(s)
      堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
    • Organizer
      日本音響学会講演論文集,1-3-3
  • [Presentation] End-to-end音声認識モデルにおける暗黙的言語情報の置換法2021

    • Author(s)
      森大輝,太田健吾,西村良太,小川厚徳,北岡教英
    • Organizer
      音学シンポジウム
  • [Presentation] 言い淀みラベル付けによる非流暢発話のEnd-to-End音声認識2021

    • Author(s)
      堀井こはる,福田芽衣子,太田健吾,西村良太,北岡教英
    • Organizer
      音学シンポジウム
  • [Presentation] Advanced language model fusion method for encoder-decoder model in Japanese speech2021

    • Author(s)
      Daiki Mori,Kengo Ohta,Ryota Nishimura,Atsunori Ogawa,Norihide Kitaoka
    • Organizer
      Proc. APSIPA ASC,pp. 503-510
  • [Presentation] End-to-end spontaneous speech recognition using hesitation labeling2021

    • Author(s)
      Koharu Horii,Meiko Fukuda,Kengo Ohta,Ryota Nishimura,Atsunori Ogawa,Norihide Kitaoka
    • Organizer
      Proc. APSIPA ASC,pp. 1077-1081
    • Int'l Joint Research

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi