研究課題/領域番号 |
15K02553
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
渡辺 美知子 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, プロジェクト非常勤研究員 (60470027)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | フィラー / コーパス / 日英語 / 独話 / 発話生成 |
研究実績の概要 |
構築中の英語話し言葉コーパス,COPEにおいて,フィラーと50ms以上のポーズに対する時間情報の付与が完了した。この情報を用いて,まず,各講演におけるフィラーの総時間とポーズの総時間が講演全体の長さに占める割合を英語・日本語間で比較した。日本語のデータには『日本語話し言葉コーパス(CSJ)』の一部を用いた。その結果,両言語間で,フィラー長の割合には有意差がないが,ポーズ長と発話部長の割合には有意差があり,日本語話者の方が間の多いスピーチをしていることが示された。次に,フィラーとポーズの語あたり頻度を両言語間で比較した。その結果,フィラーの頻度にのみ有意差があり,日本語話者の方が値は大きかった(英語4.2回/100語,日本語5.9回/100語)。さらに,フィラーの語あたり頻度を男女別に見ると,英語では男女間に有意差がないのに対し,日本語では男性話者の方が有意に高かった(女性3.7回/100語,男性8.2回/100語)。このことから,英語話者と日本語話者のフィラーの頻度を比べたとき,頻度が高いのは男性日本語話者であり,女性日本語話者の頻度は英語話者と大差ないことが示唆された。なぜ日本語話者においてのみこのように大きな男女差が観察されるのか,今後考えていく。 次に,COPEの文境界,節境界に付与したラベルを用いて,文境界,節境界のフィラーの出現率と,境界の種類や後続節長との関連を調べた。さらにその結果を,日本語について行った研究結果と比較した。どちらの言語においても後続節長が長いほどフィラーの出現率は高く,フィラーが後続発話生成の認知的負荷に関連した現象であることが示唆された。一方,境界の種類別にフィラーの出現率を比較すると,英語では文頭で最も高いのに対し,日本語では,文頭ではなく深い節境界で最も高かった。今後,境界の種類とフィラーの出現率との関連を,より詳細に調べる予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
英語話し言葉コーパスCOPEにおける,フィラーと50ms以上のポーズの時間情報ラベリングが,予定通り完了した。この情報を用いて,フィラー長,ポーズ長の割合やこれらの頻度を日英語間で比較し,新しい知見を得ることができた。英語の形態素解析も第1次作業は終わっている。また,既に付与されていた節境界ラベルを用いて,節境界におけるフィラーの出現率を調べ,後続節長や境界の種類と出現率との関係を考察した。さらに,節境界におけるフィラーの出現率に関して,日本語との対照研究も行うことができた。
|
今後の研究の推進方策 |
英語話し言葉コーパスCOPEにおいて,ラベラーの追加作業によって,文境界ラベルの客観性を高める。また,句境界ラベルの修正,形態素解析の精緻化を行う。最後に,品詞情報,句・節境界情報,時間情報,話者情報を統合した英語コーパスを作る。COPEにおいて,節よりも小さい単位である句の境界におけるフィラーの出現率を,句境界の種類や後続句長との関連で調べる。さらにその結果を日本語の研究結果と比較する。
|
次年度使用額が生じた理由 |
予定していた通信機器の購入ができなかったため。
|
次年度使用額の使用計画 |
通信のための他の機材の購入に用いる。
|