• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

「20世紀初期総合雑誌コーパス」の構築による確立期現代語の高精度な記述

研究課題

研究課題/領域番号 14310197
研究機関独立行政法人国立国語研究所

研究代表者

田中 牧郎  独立行政法人国立国語研究所, 研究開発部門, 主任研究員 (90217076)

研究分担者 笹原 宏之  独立行政法人国立国語研究所, 研究開発部門, 主任研究員 (80269505)
小椋 秀樹  独立行政法人国立国語研究所, 研究開発部門, 研究員 (00321547)
山口 昌也  独立行政法人国立国語研究所, 研究開発部門, 研究員 (30302920)
湯浅 茂雄  実践女子大学, 文学部, 教授
小木曽 智信  明海大学, 外国語学部, 専任講師 (20337489)
キーワードコーパス / 記述研究 / 現代語確立期 / 総合雑誌 / 女性雑誌 / XML / 構造化テキスト / 検索システム
研究概要

本研究は,現代日本語が確立する変化過程をとらえることのできる雑誌コーパスを構築し,これを用いて,確立期現代語の高精度な記述を実践し,コーパスによる日本語研究を新しい段階に進めることを企図するものである。平成14年度から作成に着手した「20世紀初期総合雑誌コーパス」について,平成15年度,平成16年度と段階的に作成を進め,平成16年度末には,ほぼ全体が形をなした。また,このコーパスを用いた記述研究の方法を探索するための具体的な研究も多角的に実践した。
コーパス化した対象資料は,総合雑誌『太陽』1895年・1909年・1925年,女性総合雑誌『女学雑誌』1894・1895年,『女学世界』1909年,『婦人倶楽部』1925年で,当時の日本語における言語層の広がりを,ジャンル,文体,書き手の属性,読み手の属性等の点で,幅広く反映するものであり,また,現代語が確立する変化の過程をたどることができるものである。電子テキストの作成は,文献資料の言語構造を把握し,文献資料から抽出される言語情報を,XMLによる文書の構造化と情報のマークアップという形で実現させ,記事ジャンル,著者属性,文体,引用文,校訂注記,外字等の情報を,タグによってテキスト中に埋め込んだ。当初予定していた形態素解析については,20世紀初期の語彙や表記の実態を把握する研究を進めたが,コーパス全体に解析を及ぼす段階までには至らなかった。言語研究に活用する立場から,検索システムを使い勝手のよい高機能なものにする研究も進展させた。
コーパスを用いた記述研究は,語彙・語法・文体・文字表記の各方面から多角的に展開し,成果の発表も重ねた。

  • 研究成果

    (4件)

すべて 2005 2004

すべて 雑誌論文 (4件)

  • [雑誌論文] 「敏感」の誕生と定着-『太陽コーパス』を用いて-2005

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      日本近代語研究 4集(印刷中)

  • [雑誌論文] 雑誌『太陽』創刊年(1895年)における口語文-敬体を中心に-2004

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      国語論究 11集

      ページ: 78-107

  • [雑誌論文] 近代語研究資料と研究 雑誌『太陽』2004

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      日本語学 23巻12号

      ページ: 208-220

  • [雑誌論文] 多様な構造化テキストに対応した全文検索システム『ひまわり』2004

    • 著者名/発表者名
      山口昌也, 田中牧郎
    • 雑誌名

      日本語学会2004年度秋季大会予稿集

      ページ: 165-172

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi