2019 Fiscal Year Research-status Report
日本語と英語のパラレルコーパスを用いた言い淀みの対照言語学的研究
Project/Area Number |
18K00559
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
渡辺 美知子 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (60470027)
|
Co-Investigator(Kenkyū-buntansha) |
Rose Ralph 早稲田大学, 理工学術院, 准教授 (30404916)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | フィラー / 日英語対照研究 / 非流暢性 / 発話生成プロセス / 話し言葉コーパス |
Outline of Annual Research Achievements |
フィラーは自発発話には必ずと言っていいほど出現するため,オンライン発話生成プロセスを反映した現象と考えられている。では,言語間でそれらの出現傾向に違いや共通点はあるだろうか。また,同一言語内においてもその音形によって用いられ方に違いがあるだろうか。本年度は,フィラーの音形の違いによる出現傾向の特徴を日本語と英語のパラレルコーパス(CSJとCOPE)でよく用いられるフィラーについて調べ,比較した。 まず,英語のuhとumに関して,節頭ではumの方が頻度が高く,しかも直前の境界が深いほどumの出現確率の方が急激に上昇することが明らかになった。一方,節中では,両者の出現傾向に大きな違いはなかった。このことから,umの方がuhよりも節のような大きな単位の発話生成に深く関与していることが示唆された。また,uhには話者の性別の効果があり,男性話者の方が使用頻度が高かった。これらの結果から,フィラーの種類の選択には各タイプが反映している発話生成プロセスと話者属性が関わっていることが示唆された。 次に,日本語のスピーチで高頻度のフィラー,エー,アノー,マーの出現傾向を調べ,比較した。どのタイプも直前の境界が深いほど,節頭だけでなく節中の出現率も上昇した。このことから,日本語では節の発話内容の生成が英語のように節頭で一気に行われる訳ではなく,節発話開始後にも行われていることが示唆された。節中の語数が多いほど各フィラーの出現率は上がったが節頭のマーだけは例外で,語数の効果が観察されなかった。CSJではマーの品詞分類がなされておらず,全てフィラーとされている。マーをアクセント核の有無によって副詞とフィラーに分類し再分析する必要があると考える。アノーは他のタイプに比べ,女性話者,高齢者,講演に不慣れな人の使用が多かった。このことから,アノーは話者属性を色濃く反映する傾向のあることが示唆された
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度はフィラー全体としての出現傾向を節頭のフィラーを中心に分析したが,今年度は,スピーチで頻度の高いフィラーの特徴を,日本語と英語のパラレルコーパス(CSJとCOPE)を用いて種類別に分析した。また,節頭だけでなく節中のフィラーも分析対象に含めた。これらの結果を8件の国際会議,1件の国内ワークショップにおいて発表した。分析の過程で,日本語の分析に用いている『日本語話し言葉コーパス(CSJ)』における「マー」の品詞ラベリングの課題が明らかになった。 構築中の『英語話し言葉コーパス(COPE)』に関しては,POSタグ,句・節境界タグを汎用性の高い,Penn Treebank形式に変換した。また,既にコーパスに付与されている複数の層にわたる情報のHTML形式による記述を検討している。
|
Strategy for Future Research Activity |
来年度は,2つの言語におけるオンライン発話生成メカニズムをよりダイナミックにとらえるために,フィラーやその前後のポーズの時間を要因に含めた分析を試みる予定である。文や節などの主要構成素境界のポーズには発話の切れ目を知らせるだけでなく,後続発話の内容を考えるのにも用いられていると考えられる。この点で,フィラーと働きが共通する部分がある。では,話者はどのようなときにフィラーを発するのだろうか。筆者は,境界の深さに対応した閾値以上の時間が発話再開までに必要と話者が判断したとき,まだ考え中であることを聞き手に知らせるために,フィラーが発せられるのではないかと考えている。日本語と英語のパラレルコーパスを用いてこの仮説の検証を試みる。 構築中の『英語話し言葉コーパス(COPE)』に関しては,来年度中の公開を目指し,スピーチの中に現れる個人情報の匿名化,公開の形式や利用条件の検討等を進める予定である。
|
Causes of Carryover |
2020年3月30日,31日に開催される2nd Workshop on Speech Perception and Production across the Lifespan (UCL, London, UK) に参加し,その前後にヨーロッパの研究者と情報交換をする予定だったが,コロナ禍の影響でワークショップがvirtual 開催となった。このため,出張に予定していた予算が未使用となった。来年度も多くの国際会議が,中止または延期になることが予測される。したがって,残りの予算は,主に『英語話し言葉コーパス(COPE)』の量的または質的拡張に用いたい。そのためのデータ収集やラベリングのための人件費に予算を用いる予定である。
|
Research Products
(9 results)