• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

多人数における多様な会話形態に頑健な話者ダイアライゼーションに関する研究

Research Project

Project/Area Number 25330210
Research InstitutionNagoya University

Principal Investigator

西田 昌史  名古屋大学, 未来社会創造機構, 特任准教授 (80361442)

Co-Investigator(Kenkyū-buntansha) 山本 誠一  同志社大学, 理工学部, 教授 (20374100)
Project Period (FY) 2013-04-01 – 2016-03-31
Keywords多人数会話 / 講演音声 / 発話形式 / 話者認識
Outline of Annual Research Achievements

本研究では、講演音声を対象に発話形式の違いが話者認識に与える影響を分析し、発話形式に頑健な話者認識手法について検討を行った。日本語話し言葉コーパスの学会講演と模擬講演を対象に分析を行った結果、模擬講演は話者内分散が小さく話者間分散が大きいため認識率が高く、学会講演は話者内分散が大きく話者間分散が小さいため認識率が低い傾向があり、発話形式の違いが話者認識に影響を与えることが明らかになった。これらの結果を踏まえて、学会講演と模擬講演からなる多人数の音声データで学習したUniversal
Background Model(UBM)の学習データに対して判別分析を行うことで、発話形式の違いを考慮した特徴空間を構成する手法を提案した。学会講演と模擬講演合わせて200名による話者認識実験を行った結果、従来のUBM-MAP手法では学会講演にて79.7%、模擬講演にて94.3%、提案手法では学会講演にて81.3%、模擬講演にて94.8%の認識率が得られ、いずれの講演音声に対しても認識精度の改善が得られた。したがって、提案手法により講演の発話形式を考慮した話者認識を実現することができた。
また、収録した多人数会話データに対して、音声や視線の動きなどの会話動作情報のタグ付けを行った。聞き手が話し手を見ている割合に着目して分析を行った結果、自由な会話と課題を達成するための目的会話においてどちらも話し手を見ている割合に違いがないことが明らかになった。また、会話中の沈黙の時間が自由会話に比べて目的会話の方が長いことが明らかになった。これらの結果を踏まえて、会話形式が異なる場合に音響情報のみならず沈黙などの発話動作を話者交替の検出時に考慮することの有効性を検討する必要があると考えられる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

多人数会話における話題内容や発話形式の違いが話者認識にどのような影響を与えるかを分析し、発話形式に頑健な話者認識手法について検討することが目的であり、発話形式の違いが話者認識に影響を与えることを明らかにした。また、分析結果を踏まえて提案した手法により認識精度の改善を得ることができた。

Strategy for Future Research Activity

これまでの話者認識実験や会話データの分析により、明らかになったことや検討した手法を生かすことで、話者交替の検出や話者分類技術の開発を進めていく。

  • Research Products

    (11 results)

All 2015 2014

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (9 results)

  • [Journal Article] Multimodal Corpus of Multiparty Conversations in L1 and L2 Languages and Findings Obtained from it2015

    • Author(s)
      S. Yamamoto, K. Taguchi, K. Ijuin, I. Umata, and M. Nishida
    • Journal Title

      Language Resources & Evaluation

      Volume: - Pages: -

    • DOI

      10.1007/s10579-015-9299-2

    • Peer Reviewed / Open Access
  • [Journal Article] Automatic Induction of Romanization Systems from Bilingual Corpora2015

    • Author(s)
      K. Taguchi, A. Finch, S. Yamamoto, E. Sumita
    • Journal Title

      電子情報通信学会論文誌

      Volume: J98-D Pages: 381~393

    • DOI

      10.1587/transinf.2014EDP7236

    • Peer Reviewed / Open Access
  • [Presentation] 日本語母語話者による第二言語音声を対象にした話者認識2015

    • Author(s)
      阿部将和,西田昌史,山本誠一
    • Organizer
      音響学会2015年春季研究発表会
    • Place of Presentation
      中央大学(東京都文京区)
    • Year and Date
      2015-03-16 – 2015-03-18
  • [Presentation] 第二言語での少人数会話における聞き手の視線動作の分析2015

    • Author(s)
      伊集院幸輝,田口惠子,馬田一郎,山本誠一
    • Organizer
      電子情報通信学会総合大会
    • Place of Presentation
      立命館大学(滋賀県草津市)
    • Year and Date
      2015-03-10 – 2015-03-13
  • [Presentation] 複数人会話における対話者への視線の自動推定2015

    • Author(s)
      荒木智彰,山本誠一
    • Organizer
      電子情報通信学会総合大会
    • Place of Presentation
      立命館大学(滋賀県草津市)
    • Year and Date
      2015-03-10 – 2015-03-13
  • [Presentation] 第二言語習熟度による母語と第二言語間の視線動作の相違分析2015

    • Author(s)
      堀内保大,伊集院幸輝,田口惠子,山本誠一
    • Organizer
      電子情報通信学会総合大会
    • Place of Presentation
      立命館大学(滋賀県草津市)
    • Year and Date
      2015-03-10 – 2015-03-13
  • [Presentation] 講演音声における発話形式を考慮した話者認識手法の検討2014

    • Author(s)
      中辻康太,西田昌史,山本誠一
    • Organizer
      第16回音声言語シンポジウム
    • Place of Presentation
      東京工業大学(神奈川県横浜市)
    • Year and Date
      2014-12-15 – 2014-12-16
  • [Presentation] Eye Gaze Analyses in L1 and L2 Conversations: From the Perspective of Listeners’ Eye Gaze Activity2014

    • Author(s)
      K. Ijuin, K. Taguchi, I. Umata, S. Yamamoto
    • Organizer
      UMMMI-ICMI
    • Place of Presentation
      Istanbul (Turkey)
    • Year and Date
      2014-11-16 – 2014-11-16
  • [Presentation] Multimodal Japanese Corpus of Multi-party Conversation on Two Different Topic Types2014

    • Author(s)
      K. Taguchi, K. Ijuin, I. Umata, S. Yamamoto
    • Organizer
      Oriental COCOSDA
    • Place of Presentation
      Phuket (Thailand)
    • Year and Date
      2014-09-10 – 2014-09-12
  • [Presentation] マルチモーダルコーパスを用いた母語と第二言語の沈黙時の視線行動の相違分析2014

    • Author(s)
      馬田一郎,田口惠子,伊集院幸輝,山本誠一
    • Organizer
      第13回情報科学技術フォーラム
    • Place of Presentation
      筑波大学(茨城県つくば市)
    • Year and Date
      2014-09-03 – 2014-09-05
  • [Presentation] 少人数会話での注視対象に関する比較分析2014

    • Author(s)
      伊集院幸輝,田口惠子,山本誠一,馬田一郎
    • Organizer
      第13回情報科学技術フォーラム
    • Place of Presentation
      筑波大学(茨城県つくば市)
    • Year and Date
      2014-09-03 – 2014-09-05

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi