研究課題/領域番号 |
24520523
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
丸山 岳彦 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (90392539)
|
キーワード | コーパス / 節境界 / 話し言葉 / 書き言葉 |
研究概要 |
本年度は、当初の研究計画のうち、(1)「連用節の末尾に現れる述語句の形態論的な構造を自動的に抽出し、ラベルを付与するプログラムを開発する」、(2)「付与されたラベルをもとに、どのような形態の連用節がどのように連鎖して発話が形成されるのか、そのパタンを数量的に記述する」、(3)「書き言葉における節連鎖構造の特徴を分析し、話し言葉の節連鎖構造の特徴と比較する」という3項目について、分析を進めた。 (1)は、コーパス中に現れる連用節末尾の述語句部分を解析し、自動的に「節境界構造ラベル」を付与しようとするものである。『日本語話し言葉コーパス』(CSJ)にあらかじめ付与されている節境界ラベルとほぼ同じ仕様の節境界ラベルを、『現代日本語書き言葉均衡コーパス』(BCCWJ)に対して付与した。このために、節境界検出プログラムCBAPを独自に改良したプログラムを用いた。さらに、節境界を構成する述語句に含まれるモダリティ要素を検出するプログラムを開発した。 (2)と(3)は、節境界構造ラベルを利用して、話し言葉・書き言葉に見られる節境界構造、および節連鎖構造を分析しようとするものである。(1)によるアノテーションの結果を集計し、以下の論文にまとめた。 (1) 丸山岳彦 (2013) 「現代日本語の従属節に現れるモダリティ形式の分布」『第4回 コーパス日本語学ワークショップ 予稿集』, 299-308. 国立国語研究所. (2) 丸山岳彦 (2014) 「現代日本語の連用節とモダリティ形式の分布 ―BCCWJ に基づく分析」. 益岡隆志・大島資生・橋本修・堀江薫・前田直子・丸山岳彦編. 『日本語複文構文の研究』, 399-425. ひつじ書房.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
話し言葉・書き言葉のコーパスに対する節境界ラベルの付与、モダリティ形式を検出するプログラムの開発とアノテーション、論文の執筆など、研究計画はおおむね順調に進展している。ただし、課題の一つとして挙げていた「連用節の外部関係に関する分析」には至らなかった。
|
今後の研究の推進方策 |
今年度までの分析とアノテーションの結果に基づいて、話し言葉と書き言葉を直接に比較・対照する分析を実施し、論文にまとめる。さらに、国際ワークショップを企画し、研究成果のとりまとめを行なう。
|
次年度の研究費の使用計画 |
学会参加登録費が見込んだ金額より少額だったため次年度使用額が生じた。 次年度に使用予定の「その他」に加えて使用予定である。
|