研究分担者 |
笹原 宏之 独立行政法人国立国語研究所, 研究開発部門, 主任研究員 (80269505)
小椋 秀樹 独立行政法人国立国語研究所, 研究開発部門, 研究員 (00321547)
山口 昌也 独立行政法人国立国語研究所, 研究開発部門, 研究員 (30302920)
湯浅 茂雄 実践女子大学, 文学部, 教授
小木曽 智信 明海大学, 外国語学部, 専任講師 (20337489)
|
研究概要 |
本研究は,現代日本語が確立する変化過程をとらえることのできる雑誌コーパスを構築し,これを用いて,確立期現代語の高精度な記述を実践し,コーパスによる日本語研究を新しい段階に進めることを企図するものである。平成14年度から作成に着手した「20世紀初期総合雑誌コーパス」について,平成15年度,平成16年度と段階的に作成を進め,平成16年度末には,ほぼ全体が形をなした。また,このコーパスを用いた記述研究の方法を探索するための具体的な研究も多角的に実践した。 コーパス化した対象資料は,総合雑誌『太陽』1895年・1909年・1925年,女性総合雑誌『女学雑誌』1894・1895年,『女学世界』1909年,『婦人倶楽部』1925年で,当時の日本語における言語層の広がりを,ジャンル,文体,書き手の属性,読み手の属性等の点で,幅広く反映するものであり,また,現代語が確立する変化の過程をたどることができるものである。電子テキストの作成は,文献資料の言語構造を把握し,文献資料から抽出される言語情報を,XMLによる文書の構造化と情報のマークアップという形で実現させ,記事ジャンル,著者属性,文体,引用文,校訂注記,外字等の情報を,タグによってテキスト中に埋め込んだ。当初予定していた形態素解析については,20世紀初期の語彙や表記の実態を把握する研究を進めたが,コーパス全体に解析を及ぼす段階までには至らなかった。言語研究に活用する立場から,検索システムを使い勝手のよい高機能なものにする研究も進展させた。 コーパスを用いた記述研究は,語彙・語法・文体・文字表記の各方面から多角的に展開し,成果の発表も重ねた。
|