Research Abstract |
本研究は,現代日本語が確立する変化過程をとらえることのできる雑誌コーパスを構築し,これを用いて,確立期現代語の高精度な記述を実践し,コーパスによる日本語研究を新しい段階に進めることを企図するものである。平成14年度から作成に着手した「20世紀初期総合雑誌コーパス」は,平成15年度,平成16年度,平成17年度と段階的に作成を進め,平成17年度末に完成した。また,このコーパスを用いた記述研究の方法を探索するための具体的な研究も多角的に実践した。 「20世紀初期総合雑誌コーパス」は,国立国語研究所の運営費交付金により研究代表者らが別に作成した「太陽コーパス」と,これと比較するために本課題で作成した「近代女性雑誌コーパス」とからなる。「近代女性雑誌コーパス」は,『女学雑誌』1894・1895年,『女学世界』1909年,『婦人倶楽部』1925年を対象とするものである。「20世紀初期総合雑誌コーパス」は,当時の日本語における言語層の広がりを,ジャンル,文体,書き手の属性,読み手の属性等の点で,幅広く反映するものであり,また,現代語が確立する変化の過程をたどることができるものである。電子テキストの作成は,文献資料の言語構造を把握し,文献資料から抽出される言語情報を,XMLによる文書の構造化と情報のマークアップという形で実現させ,記事ジャンル,著者属性,文体,引用文,校訂注記,外字等の情報を,タグによってテキスト中に埋め込んだ。 このコーパスに形態素解析を施すために,20世紀初期の語彙や表記の実態を把握する研究を進め,また,研究に活用する立場から,検索システムを使い勝手のよい高機能なものにする研究も進展させた。コーパスを用いた記述研究も多角的に展開し,成果の発表を重ねた。
|