• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

スムーズな対話のための対話テンポのリアルタイム制御に基づく音声対話システム

研究課題

研究課題/領域番号 19K04311
研究機関徳島大学

研究代表者

西村 良太  徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (50635878)

研究分担者 山本 一公  中部大学, 工学部, 教授 (40324230)
西崎 博光  山梨大学, 大学院総合研究部, 教授 (40362082)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワード音声対話システム / タイミング / テンポ / 音声言語情報処理 / 深層学習 / 音声認識
研究実績の概要

本研究では,音声対話システムを自然にストレス無く利用するために必要な要素は何であるかを明らかにするために,テンポを制御するモデルを研究し,対話のテンポをリアルタイムで制御可能な音声対話システムの設計・開発を行う.このために,音声対話システム内部の各モジュールに対して,最新の機械学習手法である深層学習モデルを適用し,頑健で柔軟性のあるモデルの構築を行うとともに,テンポ制御可能なリアルタイム性の高い音声対話システムを構築する.
本年度における研究では,昨年度までに構築したベース音声対話システムに組み込む各種モジュールの高精度化を行うとともに,応答制御/話者交替タイミング生成モデルの構築を行った.本モデルにおいては,入力として低次の音響情報であるスペクトログラムと,韻律情報を用いており,深層学習モデルにより話者交替のタイミングを逐次的に図っている.モデルは,LSTM層と全結合層にて構成されている。このモデルにより,無音が200ms検出された時点で話者交替のタイミングであるかどうかを判定できるため,発話終了時の判定処理が既存モデルよりも早いタイミングで開始できる.人同士の自然な対話では,応答タイミングは500ms前後で分布しており,既存モデルのように500ms以上や1000ms以上判定開始にかかるモデルでは,本研究での利用は望めない.このことから,提案モデルにより,より自然な応答タイミングでの応答制御が可能となった.
これらをシステムに組み入れ,リアルタイム制御・動作可能な分散型音声対話システムを構築した.

  • 研究成果

    (14件)

すべて 2023 2022 その他

すべて 雑誌論文 (3件) (うち査読あり 2件、 オープンアクセス 3件) 学会発表 (10件) (うち国際学会 1件) 備考 (1件)

  • [雑誌論文] A new speech corpus of super-elderly Japanese for acoustic modeling2023

    • 著者名/発表者名
      Fukuda Meiko、Nishimura Ryota、Nishizaki Hiromitsu、Horii Koharu、Iribe Yurie、Yamamoto Kazumasa、Kitaoka Norihide
    • 雑誌名

      Computer Speech & Language

      巻: 77 ページ: 101424~101424

    • DOI

      10.1016/j.csl.2022.101424

    • 査読あり / オープンアクセス
  • [雑誌論文] Input Utterance Complementation Method by Anaphora Resolution for Spontaneous Utterances on Spoken Dialog Systems2022

    • 著者名/発表者名
      Nishimura Ryota、Mori Raita、Ohta Kengo、Kitaoka Norihide
    • 雑誌名

      Transactions of the Japanese Society for Artificial Intelligence

      巻: 37 ページ: IDS~F_1-13

    • DOI

      10.1527/tjsai.37-3_IDS-F

    • 査読あり / オープンアクセス
  • [雑誌論文] フォトリアルCGエージェントとのマルチモーダル対話2022

    • 著者名/発表者名
      北岡 教英、西村 良太、太田 健吾
    • 雑誌名

      日本音響学会誌

      巻: 78 ページ: 257~264

    • DOI

      10.20697/jasj.78.5_257

    • オープンアクセス
  • [学会発表] 割り込み発話にも対応可能なリアルタイム話者交替システム2023

    • 著者名/発表者名
      杉山雅和, 太田健吾, 西村良太, 北岡教英
    • 学会等名
      日本音響学会講論集(2023春)(Web会議)
  • [学会発表] 深層学習による口唇情報を用いた雑音下での音声認識精度の改善2023

    • 著者名/発表者名
      伊達龍斗, 太田健吾, 西村良太, 北岡教英
    • 学会等名
      日本音響学会講論集(2023春)(Web会議)
  • [学会発表] 自発的発話認識のためのBERTによる非流暢文生成に基づく言語モデリング2023

    • 著者名/発表者名
      堀井こはる, 太田健吾, 西村良太, 小川厚徳, 北岡教英
    • 学会等名
      日本音響学会講論集(2023春)(Web会議)
  • [学会発表] A Corpus-based Analysis of Age-related Changes in the Acoustic Features of Elderly to Super Elderly Speech2022

    • 著者名/発表者名
      Fukuda, M., Sugiyama, M., Nishimura, R., Kitaoka, N
    • 学会等名
      The O-COCOSDA 2022
    • 国際学会
  • [学会発表] EMOtive A.I. "Saya"2022

    • 著者名/発表者名
      大須賀晋, 田中五大, 鍋倉彩那, 中野涼太, 渡邊凌太, 石川友香, 石川晃之, 中村晃一, 藤井裕也, 堀内颯太, 東中竜一郎, 西村良太, 太田健吾, 北岡教英
    • 学会等名
      人工知能学会研究会資料 言語・音声理解と対話処理研究会
  • [学会発表] BERT による雑談対話話題拡張2022

    • 著者名/発表者名
      福村考洋, 西村良太, 北岡教英
    • 学会等名
      令和4年度 電気・電子・情報関係学会 四国支部連合大会 講演論文集(Web会議)
  • [学会発表] 音声対話システムにおける対話破綻検出器の構築2022

    • 著者名/発表者名
      鳥井章宏, 西村良太, 北岡教英
    • 学会等名
      令和4年度 電気・電子・情報関係学会 四国支部連合大会 講演論文集(Web会議)
  • [学会発表] 超高齢者コーパスとS-JNAS を用いた高齢者音声の音響的特徴の分析2022

    • 著者名/発表者名
      福田芽衣子, 杉山雅和, 西村良太, 入部百合絵, 山本一公, 北岡教英
    • 学会等名
      日本音響学会講論集(2022年秋)(Web会議)
  • [学会発表] ドメイン外音響情報で補強した Encoder-Decoder 音声認識モデルの設計2022

    • 著者名/発表者名
      森大輝, 太田健吾, 西村良太, 北岡教英
    • 学会等名
      日本音響学会講論集(2022年秋)(Web会議)
  • [学会発表] End-to-End 非流暢整形音声認識システムの対話音声による評価2022

    • 著者名/発表者名
      堀井こはる, 福田芽衣子, 太田健吾, 西村良太, 小川厚徳, 北岡教英
    • 学会等名
      日本音響学会講論集(2022年秋)(Web会議)
  • [備考] DiaROS

    • URL

      https://github.com/kitaoka-lab/DiaROS

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi