2017 Fiscal Year Research-status Report
派生・複合情報を付与した歴史コーパスによる語形成の歴史的研究
Project/Area Number |
17K13471
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
村山 実和子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, プロジェクト非常勤研究員 (50783586)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | コーパス / 語構成 / 複合語 / 派生語 / 中世語 / 近世語 |
Outline of Annual Research Achievements |
本研究の目的は,中世~近世における日本語の語形成の傾向や特徴について,その実態を明らかにすることにある。中世・近世語には多様な派生語・複合語が見られるが,対象を特定せずに,語以下の要素について網羅的に収集することには困難が伴う。本研究では,コーパスに出現する語に新たに構成要素についての情報を付与し,そのデータにもとづいた計量的な分析を試みる。研究期間中に,以下の2点について実施する。 (1) 国立国語研究所が公開している『日本語歴史コーパス 室町時代編』『日本語歴史コーパス 江戸時代編』収録作品に現れる形容詞(動詞)を抽出し,それらに付与すべき構成語情報について検討,付与を行う。 (2) (1)で新たに追加したデータによって中世語・近世語の語構造を可視化し,コーパスの形態論情報と組み合わせて分析を行う(具体的には組み合わせのバリエーションや頻度,結合度などをはかる)ことで,中世~近世期における語形成のありようを記述する。 平成28年度は,『日本語歴史コーパス 室町時代編』に収録されている『虎明本狂言集』の形容詞(異なり語数237語)・動詞(異なり語数1868語)の情報を抽出し,先行研究の成果を踏まえつつ,派生語・複合語の分類基準や,構成語として認定する要素の詳細について検討を行った。比較検討のため,構築中のキリシタン資料および江戸時代の洒落本についても,該当語を一部抽出し,作業方針の策定につとめた。またその付与方法については,コーパスに紐付いた電子化辞書UniDicに情報を追加することを計画しており,そのための準備を行った。さらに,本研究の目的を達成するために,新規の中世語・近世語資料のデータ化についても検討を進めている。 平成30年度は,平成29年度に着手できなかったデータ入力作業を実施し,(2)の計量的な分析を進める計画である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
データ入力を依頼する作業者の確保に時間を要したため,当初の作業計画から変更が生じている。ただし,その他の作業(他の資料についての検討等)を優先して進めるなどの対応を行った。
|
Strategy for Future Research Activity |
構築中であったキリシタン資料,洒落本のコーパスが昨年度末に公開された。その成果を十分に活用できるよう,今年度は着実にデータ入力を進め,その整備過程や分析結果に関する成果発表を適宜行うこととする。
|
Causes of Carryover |
作業計画に変更が生じ,作業従事者への謝金ではなく機器や書籍の購入を優先したため,差額が生じた。次年度に実行する作業の従事者への謝金として充てる計画である。
|