• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

「20世紀初期総合雑誌コーパス」の構築による確立期現代語の高精度な記述

研究課題

研究課題/領域番号 14310197
研究機関独立行政法人国立国語研究所

研究代表者

田中 牧郎  独立行政法人国立国語研究所, 研究開発部門, 主任研究員 (90217076)

研究分担者 笹原 宏之  早稲田大学, 社会学部, 助教授 (80269505)
小椋 秀樹  独立行政法人国立国語研究所, 研究開発部門, 研究員 (00321547)
山口 昌也  独立行政法人国立国語研究所, 研究開発部門, 研究員 (30302920)
湯浅 茂雄  実践女子大学, 文学部, 教授
小木曽 智信  明海大学, 外国語学部, 専任講師 (20337489)
キーワードコーパス / 記述研究 / 現代語確立期 / 総合雑誌 / 女性雑誌 / XML / 構造化テキスト / 検索システム
研究概要

本研究は,現代日本語が確立する変化過程をとらえることのできる雑誌コーパスを構築し,これを用いて,確立期現代語の高精度な記述を実践し,コーパスによる日本語研究を新しい段階に進めることを企図するものである。平成14年度から作成に着手した「20世紀初期総合雑誌コーパス」は,平成15年度,平成16年度,平成17年度と段階的に作成を進め,平成17年度末に完成した。また,このコーパスを用いた記述研究の方法を探索するための具体的な研究も多角的に実践した。
「20世紀初期総合雑誌コーパス」は,国立国語研究所の運営費交付金により研究代表者らが別に作成した「太陽コーパス」と,これと比較するために本課題で作成した「近代女性雑誌コーパス」とからなる。「近代女性雑誌コーパス」は,『女学雑誌』1894・1895年,『女学世界』1909年,『婦人倶楽部』1925年を対象とするものである。「20世紀初期総合雑誌コーパス」は,当時の日本語における言語層の広がりを,ジャンル,文体,書き手の属性,読み手の属性等の点で,幅広く反映するものであり,また,現代語が確立する変化の過程をたどることができるものである。電子テキストの作成は,文献資料の言語構造を把握し,文献資料から抽出される言語情報を,XMLによる文書の構造化と情報のマークアップという形で実現させ,記事ジャンル,著者属性,文体,引用文,校訂注記,外字等の情報を,タグによってテキスト中に埋め込んだ。
このコーパスに形態素解析を施すために,20世紀初期の語彙や表記の実態を把握する研究を進め,また,研究に活用する立場から,検索システムを使い勝手のよい高機能なものにする研究も進展させた。コーパスを用いた記述研究も多角的に展開し,成果の発表を重ねた。

  • 研究成果

    (3件)

すべて 2005

すべて 雑誌論文 (3件)

  • [雑誌論文] 「敏感」の誕生と定着-『太陽コーパス』を用いて-2005

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      日本近代語研究 4

      ページ: 31-44

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 構造化された言語資料に対する全文検索システムの設計と実現2005

    • 著者名/発表者名
      山口昌也, 田中牧郎
    • 雑誌名

      自然言語処理 12-4

      ページ: 55-77

  • [雑誌論文] 言文一致と語彙の変化-『太陽コーパス』の2字漢語サ変動詞の分析による-2005

    • 著者名/発表者名
      田中牧郎
    • 雑誌名

      日本語学会2005年度秋季大会予稿集

      ページ: 197-204

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi