2016 Fiscal Year Research-status Report
歴史コーパスに基づく中世・近世語の複合辞および連語の研究
Project/Area Number |
16K16850
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
渡辺 由貴 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, プロジェクト非常勤研究員 (10569776)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 日本語史 / 複合辞 / 連語 / コーパス / 中世語 / 近世語 / N-gram |
Outline of Annual Research Achievements |
中・近世語における複合辞・連語形式については、個別形式に関する研究はなされているものの、その全体像が明らかにされているとはいいがたい。本研究は、以下の二点を目的としている。 (1)中・近世語資料における複合辞および連語の使用状況を、国立国語研究所の「日本語歴史コーパス」およびその形式に準じて追加作成したデータを用いて計量的に検証すること (2)(1)で得られた結果をもとに複合辞・連語の研究を行うこと 平成28年度は、室町時代語資料について分析対象とする資料を選定し、そこにみられる複合辞・連語形式について検討・分析を行った。 具体的には、「日本語歴史コーパス」におさめられている『虎明本狂言集』および「日本語歴史コーパス」の一部として構築段階にある『天草版平家物語』『天草版伊曽保物語』のデータを分析対象として選定した。そして、これらのデータに付与された形態論情報を利用し、それぞれの資料について2~7語の単語(短単位)N-gramデータを抽出した。このN-gramデータを出現頻度・出現環境・文法的機能・意味の希薄化等の観点から整理し、複合辞・連語リスト作成のための分析を行った。また、「日本語歴史コーパス」の形式に準じた追加データとして、『虎寛本狂言集』のデータ作成を進め、他の資料との比較分析に用いる準備を行った。本研究の経過については、国立国語研究所の共同研究プロジェクトである「通時コーパスの構築と日本語史研究の新展開」研究会等において発表した。 また、複合形式の計量的研究手法の確立を目指し、国立国語研究所のBCCWJ(現代日本語書き言葉均衡コーパス)のデータを用いた複合辞研究を行った。その成果は、「人文科学とコンピュータシンポジウム2016(じんもんこん2016)」における学会発表と、『早稲田日本語研究』26号掲載の論文の形で公開した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予定していた対象資料のうち、『虎明本狂言集』およびキリシタン資料の『天草版平家物語』『天草版伊曽保物語』について、N-gramデータの抽出と分析を進めることができた。しかし、『虎寛本狂言集』のデータ作成については、人材確保に時間がかかり作業途中であるため、次年度も継続してデータ作成を行うこととした。
|
Strategy for Future Research Activity |
平成29年度は、鎌倉時代語資料についてN-gramデータを抽出し、分析を行うとともに、室町時代語資料として引き続き『虎寛本狂言集』のデータを作成し、考察を深める。 平成30年度は、江戸語資料について同様に分析を進めるとともに、中世から近世にかけての複合辞・連語の全体像を概観し、総括的な考察を行う。
|
Causes of Carryover |
データ作成のための人材確保が困難であったため、「人件費・謝金」として計上した分の作業を進めることができなかった。
|
Expenditure Plan for Carryover Budget |
人材確保に努め、データ作成のための「人件費・謝金」とする。
|