• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

品詞素性情報つき古典漢文コーパスの発展的応用

研究課題

研究課題/領域番号 25280122
研究機関京都大学

研究代表者

安岡 孝一  京都大学, 人文科学研究所, 准教授 (20230211)

研究分担者 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 准教授 (70351294)
WITTERN C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾  大阪大学, 言語文化研究科(研究院), 講師 (20513360)
研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード古典漢文 / コーパス / 品詞解析
研究実績の概要

品詞情報を付加したコーパス化をおこなう古典漢文テキストとして、『漢文大系』から「十八史略」を選び、地名情報抽出のための古典漢文コーパスと、来年度分を一部先取りして人名情報抽出のための古典漢文コーパスを作成した。さらに、この漢文コーパスを用いた形態素解析の結果を、地名情報の抽出という側面から検討した。これに合わせ、形態素解析に用いる古典漢文辞書に、地名を大量に追加するという手法を試し、非常に良好な結果を得た。
この手法の有効性をさらに検討すべく、従来われわれが使用してきた古典漢文辞書と、今回あらたに作った古典漢文辞書、さらには、これらの古典漢文辞書からあえて全ての地名を取り除いた辞書を作成し、それらに応じてF値がどのように変化するかを検証した。結論から言えば、あらたに作った古典漢文辞書が地名抽出に際してもっともF値が高く、また、それは、地名用例以外に対して何ら悪影響を及ぼさないことが検証できた。
研究状況に関しては、逐一「東アジア古典文献コーパスの応用研究」ページ http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/ において、WWW経由での公開をおこなっている。これに加え、検討結果の一部をCHISEの「古典中国語形態素用例」としてWWW公開すると同時に、研究全体の進行状況について国際シンポジウム「Digital Humanities 2014」および「じんもんこん2014」にて発表をおこなった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

地名の抽出手法は、古典漢文辞書の見直しというかなり大胆な手法によって、思いのほか順調に開発が進んだ。これによって、来年度予定している人名の抽出手法についても、一定の目処が立っている。

今後の研究の推進方策

2015年度は、予定通り、人名に特化したキーワード抽出のためのクラスタリング手法の開発をおこない、3年間の研究の総仕上げとする。

  • 研究成果

    (10件)

すべて 2014 その他

すべて 雑誌論文 (5件) (うち査読あり 3件) 学会発表 (4件) 備考 (1件)

  • [雑誌論文] A Morphological Analysis of Classical Chinese Texts2014

    • 著者名/発表者名
      Koichi Yasuoka, Naoki Yamazaki, Christian Wittern, Yoshihiro Nikaido, Tomohiko Morioka
    • 雑誌名

      Proceedings of Digital Humanities

      巻: 2014 ページ: 410-412

    • 査読あり
  • [雑誌論文] Kanripo and Mandoku: Tools for Distributed Repositories of Premodern Chinese Texts2014

    • 著者名/発表者名
      Christian Wittern
    • 雑誌名

      Proceedings of Digital Humanities

      巻: 2014 ページ: 408-409

    • 査読あり
  • [雑誌論文] 古典中国語形態素解析による地名の自動抽出2014

    • 著者名/発表者名
      安岡孝一, 守岡知彦, Christian Wittern, 山崎直樹, 二階堂善弘, 鈴木慎吾
    • 雑誌名

      人文科学とコンピュータシンポジウム「じんもんこん」論文集

      巻: 2014 ページ: 63-68

    • 査読あり
  • [雑誌論文] 人名と漢字2014

    • 著者名/発表者名
      安岡孝一
    • 雑誌名

      HUMAN

      巻: 07 ページ: 054-057

  • [雑誌論文] 古漢字データベースの要件に関する試論2014

    • 著者名/発表者名
      守岡知彦
    • 雑誌名

      情報処理学会研究報告

      巻: 2014-CH-103(5) ページ: 1-7

  • [学会発表] 古典中国語形態素解析による地名の自動抽出2014

    • 著者名/発表者名
      安岡孝一
    • 学会等名
      じんもんこん2014
    • 発表場所
      東京(日本)
    • 年月日
      2014-12-13 – 2014-12-14
  • [学会発表] 古漢字データベースの要件に関する試論2014

    • 著者名/発表者名
      守岡知彦
    • 学会等名
      人文科学とコンピュータ研究会
    • 発表場所
      姫路(日本)
    • 年月日
      2014-08-02
  • [学会発表] A Morphological Analysis of Classical Chinese Texts2014

    • 著者名/発表者名
      Koichi Yasuoka
    • 学会等名
      Digital Humanities 2014
    • 発表場所
      ローザンヌ(スイス)
    • 年月日
      2014-07-09 – 2014-07-11
  • [学会発表] Kanripo and Mandoku2014

    • 著者名/発表者名
      Christian Wittern
    • 学会等名
      Digital Humanities 2014
    • 発表場所
      ローザンヌ(スイス)
    • 年月日
      2014-07-09 – 2014-07-11
  • [備考] 「東アジア古典文献コーパスの応用研究」ログ

    • URL

      http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi