2021 Fiscal Year Research-status Report
日本語と英語のパラレルコーパスを用いた言い淀みの対照言語学的研究
Project/Area Number |
18K00559
|
Research Institution | Waseda University |
Principal Investigator |
渡辺 美知子 早稲田大学, 理工学術院総合研究所(理工学研究所), その他(招聘研究員) (60470027)
|
Co-Investigator(Kenkyū-buntansha) |
Rose Ralph 早稲田大学, 理工学術院, 教授 (30404916)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | フィラー / 日英語対照研究 / 非流暢性 / 発話生成プロセス / 話し言葉コーパス |
Outline of Annual Research Achievements |
日本語のエート,アノー,英語のum, uhなどはフィラーと呼ばれ,自発発話では頻繁に観察される。フィラーの多くは,オンラインでの対話において何らかの理由で淀みない発話を続けることに話者が困難を感じるとき,発話の自然さを損なうことなく考える時間を確保するために用いられると考えられている。本研究では,日本語と英語でフィラーの使われ方にどのような共通点と相違点があるかを,両言語のパラレルコーパスを用い,主に節境界や文境界のフィラーを対象に調べてきた。本プロジェクトでは,『日本語話し言葉コーパス(CSJ)』の一部と対照可能な『英語話し言葉コーパス(COPE)』の構築も行った。本年度は,主に,節境界や文境界のポーズ長とフィラーの出現確率との関係について調べた。フィラーの働きがその名の通り不要な間を埋めることにあるとすれば,ポーズが長くなるほどフィラーの出現率は上昇すると考えられる。また,先行研究から,無音区間が発話全体に占める割合は日本語の方が英語よりも大きいことがわかっている。これらから,1) 節頭のフィラーの出現率はその直前のポーズ長が長いほど高い,2) ポーズ長が同じであれば,無音区間の割合の小さい英語の方が日本語よりもフィラーの出現率は高い,という仮説を立て,2つのコーパスを用いて検証した。その結果,仮説1は支持された。この結果から,日本語でも英語でも,フィラーにはその名の通り不自然な間を埋める役割のあることが示唆された。一方,仮説2は支持されなかった。則ち,特定のポーズ長に対するフィラーの出現率と,ポーズ長の変化に伴うフィラーの出現率の変化のパターンは日英語でよく似ており,どちらの言語においてもポーズ長の伸長に伴いフィラー率は漸増するのではなく段階的に増加していた。これらの結果から,節境界や文境界におけるポーズ長とフィラー率の関係に日英語で大きな違いのないことが示された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予定通り,節境界や文境界のポーズ長と直後の節頭フィラーの出現率との関係を日本語と英語について,『日本語話し言葉コーパス(CSJ)』と『英語話し言葉コーパス(COPE)』を用いて調べ,その成果を国際会議(オンライン)で発表した。また,本プロジェクトで構築した『英語話し言葉コーパス(COPE)』を,以下のURL上で研究者向けに一般公開し,研究成果の社会への還元を図った。https://www.timehill.net/asr-mt.html#asr-mt-20211216
|
Strategy for Future Research Activity |
2021年度,節境界や文境界のポーズ長と直後の節頭フィラーの出現率との関係を調べる研究に着手し,ポーズ長の伸長に伴いフィラー率は増加すること,フィラー率増加のパターンは日本語と英語でよく似ており,ポーズ長の伸長に伴い漸増するのではなく段階的に増加することが明らかになった。則ち,どちらの言語においてもポーズ長が100msを超える時点と500msを超える時点でフィラー率に大幅な増加が見られた。今後,なぜこのような現象が起きるのかについて,発話生成メカニズムの観点から研究を進めたい。節頭フィラーの出現率に影響すると考えられる要因は多様で,相互に関連もあると考えられる。そこで,2022年度はこれまでの研究成果もふまえながら,より複合的に節頭フィラーの出現率に影響する要因を日本語,英語について調べる予定である。さらに,それらの要因がフィラー率だけでなくフィラー長にも影響しているかどうかを調べたい。また,web上で公開した『英語話し言葉コーパス(COPE)』がより多くの研究者に利用してもらえるよう,学会,研究会などでアピールする予定である。
|
Causes of Carryover |
昨年度に続くコロナ禍のために学会や研究会の開催が限られ,主にそれらへの参加に充てる予定だった予算(会議参加費,資料代,旅費等)が残った。2022年度,国内外での往来がより自由にできるようになれば,積極的に研究発表を行っていきたい。コロナ禍の制約が続く場合は,本プロジェクトで構築した『英語話し言葉コーパス(COPE)』の拡充のために予算を用いたい。
|