2020 Fiscal Year Research-status Report
日本語と英語のパラレルコーパスを用いた言い淀みの対照言語学的研究
Project/Area Number |
18K00559
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
渡辺 美知子 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (60470027)
|
Co-Investigator(Kenkyū-buntansha) |
Rose Ralph 早稲田大学, 理工学術院, 准教授 (30404916)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | フィラー / 日英語対照研究 / 非流暢性 / 発話生成プロセス / 話し言葉コーパス |
Outline of Annual Research Achievements |
フィラーは,朗読音声にはほとんど現れないが,自発発話では頻繁に観察される。このため,フィラーは,即興で考えながら話すオンライン発話生成に関連した事象と考えられている。フィラーは,日本語話者の間では発話中の自然な現象ととらえられているのに対し,英語話者の間では否定的に見なされる傾向がある。また,日英語の先行研究を比較すると,フィラーの出現頻度は,日本語の方が英語よりも高い傾向がある。そこで本プロジェクトでは,まず,既存の『日本語話し言葉コーパス(CSJ)』と対照研究が可能な英語コーパス『英語話し言葉コーパス(COPE)』を構築した。そして,両コーパスを用いてフィラーの出現頻度やフィラー使用に影響すると思われる要因について調べ,両言語における結果を比較してきた。その結果,まず,フィラーの使用頻度は日本語話者の方が高かったが,日本語では男女で有意差があり,男性話者の方が使用率が高かった。英語では男女間に有意差はなく,日本語話者のフィラーの使用率の高さは男性話者に起因していることが明らかになった。次に,節頭のフィラーの出現率に影響すると考えられる要因を調べた。どちらの言語においても,後続節が長いほどフィラーの出現率は上昇した。この結果から,フィラーには後続発話生成のための時間確保の役割があり,その出現率は後続発話生成のための認知的負荷に対応していることが示唆された。また,日本語では,直前の境界が深いほど節頭でも節中でもフィラーの出現率は高い傾向があるのに対し,英語では,境界の深さの影響は節頭フィラーの出現率に限られていた。統語境界の深さは談話の切れ目の深さに対応し,深いほど後続発話プラニングの負荷は大きくなると考えられる。上記の結果から,英語では後続発話プラニングは主に節頭で行われるのに対し,日本語では発話開始前だけでなく開始後も徐々に発話内容の生成が行われていることが示唆された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
これまで,研究計画に沿って,まず,フィラーの全体的な出現傾向を調べ,日英語で比較した。次に,ケースを節頭フィラーと節中フィラーに分け,それぞれの出現率に影響する要因を調べた。さらに,フィラーの種類別に出現率に影響する要因を調べ,フィラータイプ別に特徴を明らかにした。現在,節境界のポーズ長とフィラーの出現率の関係を調べており,近く,その研究成果の一部を発表する予定である。本プロジェクトで構築してきた『英語話し言葉コーパス(COPE)』は,匿名化処理やファイル間の情報の不一致の修正もほぼ終了し,今年度中に公開できる見通しである。
|
Strategy for Future Research Activity |
これまで,主として,後続節長や統語境界の深さと節頭,節中のフィラーの出現率の関係について調べてきた。現在,これまで同様,日本語と英語の話し言葉コーパスを用いながら,節境界のポーズ長とフィラーの出現率の関係について調べている。文境界や節境界にはポーズが置かれることが多い。ポーズには,話の切れ目を示し,聞き手の理解を促す役割があるが,話し手は,ポーズの間に,後続発話の内容や表現を考えることができる。深い統語境界では,間があっても不自然ではない。では,話者はなぜ,節頭でフィラーを発するのだろうか。言い換えると,話者が深い統語境界でフィラーを使うのはどんなときだろうか。筆者は,話し手には境界の深さに対応した適切なポーズ長の基準があり,その閾値以上の時間が発話の再開までに必要になると判断したとき,まだ考え中であることを聞き手に知らせるために,フィラーを発するのではないかと考えている。日本語の方が講演全体に対するポーズ長比が大きいので,各境界におけるポーズ長,境界でフィラーを発するまでのポーズ長も日本語の方が長いと予測している。この仮説を定量的に検証するために,現在,ポーズ長の分析を進めており,今後も続ける予定である。
|
Causes of Carryover |
昨年度末から,コロナ禍の影響で,参加を予定していた複数のワークショップや会議がオンライン開催や延期となった。このため,出張に予定していた予算が未使用となった。来年度,会議などが再開されれば,そこで研究成果を発表し,情報交換を行いたい。来年度もコロナ禍が続く場合は,『英語話し言葉コーパス(COPE)』の量的・質的拡張を行いたい。具体的には,コーパスのデータ収集やラベリングのための人件費に予算を用いる予定である。
|