• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Annual Research Report

品詞素性情報つき古典漢文コーパスの発展的応用

Research Project

Project/Area Number 25280122
Research InstitutionKyoto University

Principal Investigator

安岡 孝一  京都大学, 人文科学研究所, 准教授 (20230211)

Co-Investigator(Kenkyū-buntansha) 山崎 直樹  関西大学, 外国語学部, 教授 (30230402)
二階堂 善弘  関西大学, 文学部, 教授 (70292258)
師 茂樹  花園大学, 文学部, 准教授 (70351294)
WITTERN C.  京都大学, 人文科学研究所, 教授 (20333560)
池田 巧  京都大学, 人文科学研究所, 教授 (90259250)
守岡 知彦  京都大学, 人文科学研究所, 助教 (40324701)
鈴木 慎吾  大阪大学, 言語文化研究科(研究院), 講師 (20513360)
Project Period (FY) 2013-04-01 – 2016-03-31
Keywords古典漢文 / コーパス / 品詞解析
Outline of Annual Research Achievements

品詞情報を付加したコーパス化をおこなう古典漢文テキストとして、『漢文大系』から「十八史略」を選び、地名情報抽出のための古典漢文コーパスと、来年度分を一部先取りして人名情報抽出のための古典漢文コーパスを作成した。さらに、この漢文コーパスを用いた形態素解析の結果を、地名情報の抽出という側面から検討した。これに合わせ、形態素解析に用いる古典漢文辞書に、地名を大量に追加するという手法を試し、非常に良好な結果を得た。
この手法の有効性をさらに検討すべく、従来われわれが使用してきた古典漢文辞書と、今回あらたに作った古典漢文辞書、さらには、これらの古典漢文辞書からあえて全ての地名を取り除いた辞書を作成し、それらに応じてF値がどのように変化するかを検証した。結論から言えば、あらたに作った古典漢文辞書が地名抽出に際してもっともF値が高く、また、それは、地名用例以外に対して何ら悪影響を及ぼさないことが検証できた。
研究状況に関しては、逐一「東アジア古典文献コーパスの応用研究」ページ http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/ において、WWW経由での公開をおこなっている。これに加え、検討結果の一部をCHISEの「古典中国語形態素用例」としてWWW公開すると同時に、研究全体の進行状況について国際シンポジウム「Digital Humanities 2014」および「じんもんこん2014」にて発表をおこなった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

地名の抽出手法は、古典漢文辞書の見直しというかなり大胆な手法によって、思いのほか順調に開発が進んだ。これによって、来年度予定している人名の抽出手法についても、一定の目処が立っている。

Strategy for Future Research Activity

2015年度は、予定通り、人名に特化したキーワード抽出のためのクラスタリング手法の開発をおこない、3年間の研究の総仕上げとする。

  • Research Products

    (10 results)

All 2014 Other

All Journal Article (5 results) (of which Peer Reviewed: 3 results) Presentation (4 results) Remarks (1 results)

  • [Journal Article] A Morphological Analysis of Classical Chinese Texts2014

    • Author(s)
      Koichi Yasuoka, Naoki Yamazaki, Christian Wittern, Yoshihiro Nikaido, Tomohiko Morioka
    • Journal Title

      Proceedings of Digital Humanities

      Volume: 2014 Pages: 410-412

    • Peer Reviewed
  • [Journal Article] Kanripo and Mandoku: Tools for Distributed Repositories of Premodern Chinese Texts2014

    • Author(s)
      Christian Wittern
    • Journal Title

      Proceedings of Digital Humanities

      Volume: 2014 Pages: 408-409

    • Peer Reviewed
  • [Journal Article] 古典中国語形態素解析による地名の自動抽出2014

    • Author(s)
      安岡孝一, 守岡知彦, Christian Wittern, 山崎直樹, 二階堂善弘, 鈴木慎吾
    • Journal Title

      人文科学とコンピュータシンポジウム「じんもんこん」論文集

      Volume: 2014 Pages: 63-68

    • Peer Reviewed
  • [Journal Article] 人名と漢字2014

    • Author(s)
      安岡孝一
    • Journal Title

      HUMAN

      Volume: 07 Pages: 054-057

  • [Journal Article] 古漢字データベースの要件に関する試論2014

    • Author(s)
      守岡知彦
    • Journal Title

      情報処理学会研究報告

      Volume: 2014-CH-103(5) Pages: 1-7

  • [Presentation] 古典中国語形態素解析による地名の自動抽出2014

    • Author(s)
      安岡孝一
    • Organizer
      じんもんこん2014
    • Place of Presentation
      東京(日本)
    • Year and Date
      2014-12-13 – 2014-12-14
  • [Presentation] 古漢字データベースの要件に関する試論2014

    • Author(s)
      守岡知彦
    • Organizer
      人文科学とコンピュータ研究会
    • Place of Presentation
      姫路(日本)
    • Year and Date
      2014-08-02
  • [Presentation] A Morphological Analysis of Classical Chinese Texts2014

    • Author(s)
      Koichi Yasuoka
    • Organizer
      Digital Humanities 2014
    • Place of Presentation
      ローザンヌ(スイス)
    • Year and Date
      2014-07-09 – 2014-07-11
  • [Presentation] Kanripo and Mandoku2014

    • Author(s)
      Christian Wittern
    • Organizer
      Digital Humanities 2014
    • Place of Presentation
      ローザンヌ(スイス)
    • Year and Date
      2014-07-09 – 2014-07-11
  • [Remarks] 「東アジア古典文献コーパスの応用研究」ログ

    • URL

      http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kyodokenkyu/

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi