• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

古典資料に対するテキストマイニングおよびその分析結果の可視化に関する研究

研究課題

研究課題/領域番号 26730169
研究機関立命館大学

研究代表者

木村 文則  立命館大学, 衣笠総合研究機構, 研究員 (70516690)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード重要語抽出 / テキストマイニング
研究実績の概要

本研究では,電子テキスト化された古典資料(『吾妻鑑』などの平安時代~鎌倉時代に書かれた史料)に対しテキストマイニングを行うことにより人物や地名などの情報の抽出を行い,それらの分析をし,その結果の可視化を行う.
平成26年度は,古典資料に対してテキストマイニングを行うために必要な古文の重要語抽出器の作成を行った.本手法ではサポートベクターマシンによる機械学習を用いている.今年度は,『東大寺要録』および『役者評判記』を対象として実験を行った.また,これらの資料に対しては人手により注釈が付与されており,この注釈を教師データとして学習を行うことにより,人名や地名,建物などの抽出を行った.その結果,一定の抽出精度が得られ,本手法の有用性が実証できた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成26年度の目標は,電子テキスト化された古典資料から人物や地名などの情報を抽出することが目的であったが,その目的はある程度達成できた.これまでは人名の抽出が中心であったが,今年度では人名以外の抽出もある程度実現し,それを一層進めていく道筋がつけられたと考えている.特に,これまでは『吾妻鑑』などの平安時代~鎌倉時代に書かれた史料が主な対象であったが,それ以外の史料(『東大寺要録』および『役者評判記』)を対象に実験を行ったことにより,提案手法が特定の時代の史料に限定される手法ではなく,汎用性があることが実証できたのは成果であると考えている.
ただし,もう一つの課題であった,研究代表者が以前に提案した単語分割手法の改善については十分な成果が得られなかったため,全体としては「おおむね順調に進展している」との評価になると考えている.

今後の研究の推進方策

平成27年度は,提案した重要語抽出器の性能を向上したいと考えている.人名以外の地名や建物なども抽出できるようにはなったが,この抽出精度を向上したいと考えている.また,それ以外のさまざまな項目についても抽出できるように改善したいと考えている.
さらに,上記で抽出した結果を用い,分析を行う手法について検討し,実現することを考えている.研究代表者は以前,人物関係を表すのに地名を媒介とする手法を提案したが,これを地名以外の項目にも拡張することなどにより,より深い分析を行うことのできる手法を実現することを検討している.

次年度使用額が生じた理由

購入した実験用PCが,当初予定した金額より安く購入できたため.

次年度使用額の使用計画

実験データ等の保存のためのストレージの購入を行う.また,研究の進展により得られた成果の公表を行うため,国内・国際会議に参加する際の参加費,旅費に充てる予定である.

  • 研究成果

    (4件)

すべて 2014

すべて 学会発表 (4件)

  • [学会発表] Developing a Collaborative Annotation System for Historical Documents by Multiple Humanities Researchers2014

    • 著者名/発表者名
      Takafumi Sato, Makoto Goto, Fuminori Kimura, and Akira Maeda
    • 学会等名
      The 7th International Conference on Computer Science and Information Technology (ICCSIT2014)
    • 発表場所
      Barcelona, Spain
    • 年月日
      2014-12-23 – 2014-12-23
  • [学会発表] 東大寺要録からの歴史知識情報の抽出 ―注釈情報の共有を目指して―2014

    • 著者名/発表者名
      佐藤 貴文, 後藤 真, 木村 文則, 前田 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 発表場所
      国立情報学研究所(東京都)
    • 年月日
      2014-12-13 – 2014-12-13
  • [学会発表] 役者評判記からの人物表現抽出手法の提案2014

    • 著者名/発表者名
      永井 規善, 前田 亮, 木村 文則, 赤間 亮
    • 学会等名
      人文科学とコンピュータシンポジウム
    • 発表場所
      国立情報学研究所(東京都)
    • 年月日
      2014-12-13 – 2014-12-13
  • [学会発表] Method for Supporting Analysis of Personal Relationships through Place Names Extracted from Documents2014

    • 著者名/発表者名
      Fuminori Kimura and Akira Maeda
    • 学会等名
      Digital Libraries 2014: ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014) and International Conference on Theory and Practice of Digital Libraries (TPDL 2014)
    • 発表場所
      London, U.K
    • 年月日
      2014-09-10 – 2014-09-10

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi