2013 Fiscal Year Research-status Report
日本語学習者のためのコーパスを利用したコロケーション検索システムの開発と試行
Project/Area Number |
25370591
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Yamaguchi University |
Principal Investigator |
中溝 朋子 山口大学, 留学生センター, 准教授 (70305217)
|
Co-Investigator(Kenkyū-buntansha) |
坂井 美恵子 大分大学, 国際教育研究センター, 准教授 (60288868)
金森 由美 大分大学, 国際教育研究センター, 講師 (80264323)
大岩 幸太郎 大分大学, 教育福祉科学部, 非常勤講師 (90223726)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | コロケーション / 検索システム / コーパス / 機能動詞 |
Research Abstract |
25年度は、①機能動詞に関する調査と分析、②修飾語と名詞(被修飾語)、および名詞と動詞のコロケーション検索プログラムの作成、③例文作成の3点について研究、および作業を行った。①については、本検索プログラムによる名詞と動詞のコロケーションの検索結果を分類して学習者に表示する際に必要となる村木(1991)の機能動詞のアスペクトを表す動詞について『現代日本語書き言葉均衡コーパス』(国研2011、以下BCCWJ)における名詞との共起状況(同じ相に属する動詞ごとの共起する名詞)の特徴について検討した。 ②については、プログラム作成を専門家に依頼し、BCCWJの特徴の分析、例文および参考となる指標を表示するための複数文献の表記を一致させるための対応方法、修飾語と名詞(被修飾語)、および名詞と動詞のコロケーションの定義、コロケーション強度の指標として用いるダイス係数の計算方法等を検討した上で、BCCWJにおけるコロケーションの検索、ダイス係数の計算プログラムを作成した。これらの検討の結果、本システムで扱うコロケーションの範囲を名詞(中心語)は旧日本語能力試験の1級、および2級、かつ動詞(共起語)との共起頻度は10以上に限ることとした。またそれに伴い、プログラムの作成計画の手順等にいくつかの変更を加えることとした。(修飾語と被修飾語、名詞と動詞の)ダイス係数の計算プログラムまではほぼ完成したが、名詞と動詞のコロケーションの検索結果を3分類するプログラムについては今後の課題であり、複数文献の表記の一致、それを用いた例文の表示方法についても今後さらに検討が必要である。 ③については大分大学を中心に例文を作成し、英語、中国語、韓国語の訳を作成している。現在、本グループで本研究に先行して行っているコロケーション習得用web教材で使用した例を含め約1500例の例文を収集し、中国語に関してはほぼその翻訳が終了した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
25年度は、特に機能動詞の分析、名詞と動詞のコロケーションの定義の特定、学習者に例文や参考となる指標を提示するための複数文献の表記を一致させるための対応方法に、予想以上に時間を要してしまった。そのため前項の①については、機能動詞の3種類のうち整理が終了したのはアスペクトのみである。 ②については、当初26年度に実施予定であった修飾語と名詞(被修飾語)のコロケーション検索プログラム、およびダイス係数の計算プログラムがほぼ完成できたことは、先行できた点であるが、修飾語についても複数文献の表記を一致させるという新たな課題があることがわかり、26年度に実施することとなった。 ③については、コロケーション習得のためのweb教材で作成した例文の整理と新たな例文作成を行ったが、検索対象とするコロケーションの絶対数が多いため、さらなる例文作りが必要である。
|
Strategy for Future Research Activity |
26年度は、前項①の機能動詞については、村木(1991)で挙げられているヴォイス、ムードに属する動詞と共起する名詞の調査・分析を引き続き行う予定である。 ②については、名詞と動詞のコロケーションに関する複数文献の表記の一致についてさらに検討を進めるとともに、修飾語に関しても複数文献の間の表記の一致を行う。さらに名詞と動詞のコロケーションについては、学習者に表示するために、上述の①の結果を基に、名詞と動詞のコロケーションの動詞を3種類の機能動詞的結合(「実質的意味」「機能的意味」「複合助辞的意味」)に分類するためのプログラムを完成したい。ただし①の調査・分析とは別に、「複合助辞的意味」についてはその抽出方法についてプログラム作成者とともに今後検討が必要である。 ③については、例文作成への協力者を増員し、引き続きできるだけ多くの例文を収集したい。
|
Expenditure Plans for the Next FY Research Funding |
当初計画と大きく異なったのは、「人件費・謝金」の費目である。これは、当初計画では『分類語彙表』の分類番号を利用した「漢語名詞・動詞の自動タグ付けプログラム」を作成する予定であったのだが、機能動詞のアスペクトを表す動詞と名詞の共起状況を分析した結果、『分類語彙表』の使用が当初予想よりも困難で、むしろ検索対象を限定することで効率化が図れると考えられ、タグ付けの自動化プログラム作成は行わないとしたためである。 その他、機能動詞の分析が遅れたことによるデータ収集・整理補助のための謝金の未使用などによる。 25年度の名詞と動詞のコロケーションプログラム作成の過程で、当初は予定していなかった修飾語に関する複数文献の表記の一致について、今後検討する必要があることがわかった。25年度に未使用であった上記のプログラム作成予算は、これに充当させる予定である。 その他、謝金については、例文作成のための協力者を増員し、謝金に充当する予定である。
|
Research Products
(5 results)