• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

日本語と英語のパラレルコーパスを用いた言い淀みの対照言語学的研究

Research Project

Project/Area Number 18K00559
Research InstitutionWaseda University

Principal Investigator

渡辺 美知子  早稲田大学, 理工学術院総合研究所(理工学研究所), その他(招聘研究員) (60470027)

Co-Investigator(Kenkyū-buntansha) Rose Ralph  早稲田大学, 理工学術院, 教授 (30404916)
Project Period (FY) 2018-04-01 – 2024-03-31
Keywordsフィラー / 日英語対照研究 / 非流暢性 / 発話生成プロセス / 話し言葉コーパス / 言い淀み
Outline of Annual Research Achievements

不自然に長いポーズやフィラーなどの言い淀み(非流暢性)は自発発話に固有の特徴で朗読音声にはほとんど現れない。このような非流暢性は相手のある発話をタイミングよく続けなければならないというオンライン発話生成に関連した現象と考えられている。このような現象はどこまでが言語普遍的でありどこからが各言語に固有のものだろうか。この問題にアプローチするため,本プロジェクトでは対照研究か可能になるような日英語の話し言葉コーパスを構築し,両者におけるポーズやフィラーの出現の仕方を調べてきた。コーパスは,日本語は『日本語話し言葉コーパス(CSJ)』の一部を用いた。英語は,CSJ中の「模擬講演」と対照可能になるよう話者特性と講演内容を選定し,20名のアメリカ英語話者による『英語話し言葉コーパス(COPE)』を構築した。そして,両コーパスにおけるポーズとフィラーの出現形態を節境界,文境界を中心に調べ比較した。
その結果,まず,無音区間長の総計が発話全体に占める割合は英語よりも日本語の方が有意に大きいことがわかった。これは,日本語話者の方が間の多い発話をしていることを示唆している。一方で,フィラー長の総計の割合と語あたりの頻度に両言語間で有意差はなかった。これらの結果から,両言語の発話の仕方の違いは主にポーズの取り方の違いに現れることが推測された。そこで,発話生成単位の一つと考えられている節の境界に着目し,そこにおけるポーズの出現率と長さ,ならびにフィラーの出現率を調べ,両言語間で比較した。その結果,英語ではポーズのない節境界が日本語の倍以上あり,英語の無音区間の割合の小ささはこのことに起因していることが推察された。一方,ポーズ長に呼応して後続フィラーの出現率が上昇する点は両言語で共通していた。このことから,どちらの言語においてもフィラーが不自然な間を埋める役割を担っていることが示唆された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

節境界のポーズ長と後続フィラーの出現率との関係を日本語と英語について『日本語話し言葉コーパス(CSJ)』の一部と『英語話し言葉コーパス(COPE)』を用いて調べ,その成果を発表した。また,本プロジェクトで構築した『英語話し言葉コーパス(COPE)』を,以下のURL上で研究者向けに引き続き一般公開し,研究成果の社会への還元を図った。https://www.timehill.net/asr-mt.html#asr-mt-20211216

Strategy for Future Research Activity

今後,節境界のフィラー長と後続フィラーの出現率との関係を,節境界のタイプやフィラーの種類に留意しながらより詳細に調べることによって,日本語と英語におけるポーズの取り方,ひいては発話生成の仕方の異同の解明を試みる。さらに今後,自発発話コーパスを外国語教育へ応用するための研究を進める。具体的には,母語話者の発話に現れる非流暢性のうち,どのようなタイプを教材に取り入れるのが学習者の理解や発話能力の育成に役立つのかを,非流暢性の働きについて母語話者を対象とした研究の成果をもとに検討する。さらに,非流暢性を含む音声教材をAIで生成することの可否,留意点や課題についても考える。また,web上で公開した『英語話し言葉コーパス(COPE)』がより多くの研究者に利用してもらえるよう,学会,研究会などで広くアピールする。

Causes of Carryover

昨年度に続くコロナ禍のために学会や研究会の開催が限られ,主にそれらへの参加費に充てる予定だった予算(会議参加費,資料代,旅費等)が残った。2023年度は国内外での往来が自由にできるようになりそうなので,予算の許す限り積極的に研究発表を行っていきたい。

  • Research Products

    (2 results)

All 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (1 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Ethical Considerations in the Use of Disfluencies in AI-generated Speech2023

    • Author(s)
      Rose, R.L.
    • Journal Title

      Proceedings of the 15th International Conference on Computer Supported Education

      Volume: 2 Pages: 128-135

    • DOI

      10.5220/0011987200003470

    • Peer Reviewed / Open Access
  • [Presentation] Speech Repairs and Oral Fluency: What Can We Learn from L1 Speech Data?2023

    • Author(s)
      Rose, R.L.
    • Organizer
      57th RELC International Conference
    • Int'l Joint Research

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi