• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

和漢の両系統を統合する平安・鎌倉時代語コーパス構築のための語彙論的研究

研究課題

研究課題/領域番号 24320086
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

田中 牧郎  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (90217076)

研究分担者 小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
高田 智和  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・構造研究系, 准教授 (90415612)
山本 真吾  白百合女子大学, 文学部, 教授 (70210531)
藤原 浩史  中央大学, 文学部, 教授 (00219065)
池田 幸恵  長崎大学, 水産・環境科学総合研究科, 准教授 (10315228)
柳原 恵津子  中央大学, 文学部, 准教授 (50401162)
須永 哲矢  昭和女子大学, 人間文化学部, 非常勤講師 (10589584)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード日本語史 / 古代語 / 語彙 / 文体的変異 / コーパス
研究概要

和漢の両系統を統合できるような平安・鎌倉時代語のコーパスを作成するための基本問題のうち、(1)電子化とタグ付け、(2)形態素解析用の電子化辞書への語彙登録、の2点について、漢文資料と和漢混淆文資料を対象に重点的な研究を行った。それらと並行して、(3)コーパスを活用することで開けてくる平安・鎌倉時代の語彙論的研究の新領域について、試作中のコーパスを用いて研究した。
(1)電子化とタグ付けについては、前年度にコーパス化の当面の対象に定め入力を実施した、『続日本紀宣命』『高山寺本古往来』『法華百座聞書抄』『尾張国解文』等を対象に、異体字処理、返読処理、補読処理、欠字処理などについて、その実態を観察して、電子化の基準を定め、タグセットを考案する研究を発展させた。また、既存の電子テキストを使う『今昔物語集』についても、同様の研究を進め、コーパスとして使用に耐える構造化テキストを構築した。
(2)電子化辞書への語彙登録については、上記の各種資料に、別の研究プロジェクトで作成した、平安時代和文資料用の解析辞書「中古和文UniDic」で形態素解析を施し、「未知語」として出力されるものや、誤解析になるものの登録を進め、和漢混淆文にも形態素解析を実現できる電子化辞書の整備を進めた。
(3)コーパスを活用した語彙論的研究については、コーパス化が先行している『今昔物語集』『宇治拾遺物語』など一部の試作データを用いて、新たに研究領域の開拓に努め、その第一の成果として、文体の異なる同一内容の説話をパラレルコーパスにして、語の対応を分析する研究を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

(1)電子化とタグ付け、(2)電子化辞書への語彙登録、のいずれにおいても、問題点を明確に整理した上で、具体的な作業を進めることができ、資料数点の電子化とタグ付けをほぼ完成させ、それらに形態素解析をかけるための電子化辞書の整備も進んだ。(3)についても、いくつかの論点を定めた上で、パラレルコーパスによる語の対応の研究について成果を論文にまとめることができた。よって、研究の進捗は順調だと言える。

今後の研究の推進方策

平成24年度、25年度に選定し、電子化とタグ付けを終え、解析用の電子化辞書への語彙登録を進めた諸資料について、コーパスを完成させ、公開に向けた準備を行う。そられを活用した語彙研究についても、幅広く展開していく。

次年度の研究費の使用計画

コーパス試作を行う作業について、作業者への謝金を計上していたが、コーパス試作作業にソフトウェアを導入したことで、作業の効率化を図ることができ、謝金が少なくて済んだ。次年度は、試作したコーパスを活用した語彙論研究をより活発に行うことと、研究成果の公開のための学会参加のための経費がかかることが予想されたため、そこに費用を充てることとした。
研究分担者を追加し分担金を配分することで、コーパスを活用した語彙論的研究を、より活性化させる。また、研究成果を発表するために、学会に参加する旅費を、当初予定よりも増額させる。

  • 研究成果

    (10件)

すべて 2014 2013 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (7件) 図書 (1件)

  • [雑誌論文] .『今昔物語集』と『宇治拾遺物語』の同文説話における語の対応―語の文体的価値の記述―2014

    • 著者名/発表者名
      田中牧郎・山元啓史
    • 雑誌名

      日本語の研究

      巻: 10-1 ページ: 16-30

    • 査読あり
  • [雑誌論文] 『日本語歴史コーパス』のための書籍活字の電子化-小学館新全集『今昔物語集』を事例として-2013

    • 著者名/発表者名
      須永哲矢・堤智昭
    • 雑誌名

      国立国語研究所論集

      巻: 6 ページ: 163-181

    • 査読あり
  • [学会発表] 『今昔物語集』における文体対立語―巻12と巻27の語彙比較による―2014

    • 著者名/発表者名
      田中牧郎
    • 学会等名
      第5回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20140306-20140307
  • [学会発表] 『法華百座聞書抄』のテンス・アスペクト形式:『今昔物語集』との比較2014

    • 著者名/発表者名
      野田高広
    • 学会等名
      第5回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20140306-20140307
  • [学会発表] 『今昔物語集』の捨て仮名2014

    • 著者名/発表者名
      冨士池優美・岩崎瑠莉恵
    • 学会等名
      第5回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20140306-20140307
  • [学会発表] 文体から見た『今昔物語集』の語彙―『日本語歴史コーパス 平安時代編』と比較して―2013

    • 著者名/発表者名
      田中牧郎
    • 学会等名
      第4回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20130904-20130905
  • [学会発表] 「五国史」宣命のコーパス化2013

    • 著者名/発表者名
      池田幸恵・須永哲矢
    • 学会等名
      第4回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20130904-20130905
  • [学会発表] 冨士池優美・河瀬彰宏・野田高広・岩崎瑠莉恵2013

    • 著者名/発表者名
      『今昔物語集』のテキスト整形
    • 学会等名
      第4回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20130904-20130905
  • [学会発表] 『今昔物語集』話末評語の漢語の性格について

    • 著者名/発表者名
      山本真吾
    • 学会等名
      漢字漢語研究会
    • 発表場所
      早稲田大学
  • [図書] 漢文資料をよむ2013

    • 著者名/発表者名
      沖森卓也・齋藤文俊・山本真吾
    • 総ページ数
      156
    • 出版者
      朝倉書店

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi