• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

テキストマイニング分析による史学的知識抽出に関する研究

研究課題

研究課題/領域番号 26730167
研究機関東京大学

研究代表者

山田 太造  東京大学, 史料編纂所, 助教 (70413937)

研究期間 (年度) 2014-04-01 – 2018-03-31
キーワード歴史情報 / 日本史 / テキストマイニング / 情報検索 / メタデータ
研究実績の概要

本研究では日本史学研究における研究過程支援のため,史料目録・テキストから史学的知識を抽出し,知識間・知識-史料間・史料間などの関係を明確にしながら,内在する史学的知識・暗黙知を外在化する研究を行うため,特に(1)史学的知識の抽出・蓄積,(2)史学的知識間,史学的知識-史料間,史料間の関連性の検出,(3)知識表現・関連表現とそれらを用いた検索手法の確立を解決する.
平成26年度は,史学研究者が研究過程で蓄積している史学的知識,特に天正記の史料を用いて人名・時間に着目し,調査・分析を進め,分析の結果に基づき,知識および各種関連の表現方法,さらに蓄積方法を提案するため,上記の(1)および(3)についてデザインし,プロトタイピングを進めた.
これにより,ある人物を時系列に追跡し,人名間の関係を提示するなどの日本史における人名に関するテキストマイニングの実現を進めた.
最初の段階であるため,人名・時間に特化してシステムのプロトタイピングしテキストマイニングの結果を分析した.しかしながら,他の知識については扱っていないため,知識表現・各種関連のデザインや蓄積のためのプロトタイプシステムの完成度は低くく,上記の(3) における検索手法としては,十分な機能を持ち合わせていないと考えられる.この後,史学研究者から初期段階でのプロトタイプの利用を通じた率直な意見を収集し,それを分析することでよりよいシステムを構築していくことができると考えている.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

天正記の史料を用いて人名・時間に着目し,調査・分析を進め,分析の結果に基づき,知識および各種関連の表現方法,さらに蓄積方法を提案するため,史学的知識の抽出・蓄積,知識表現・関連表現についてデザインし,プロトタイピングを進めた.
人物を時系列に追跡し,人名間の関係を提示するなどの日本史における人名に関するテキストマイニングの実現を進めた.

今後の研究の推進方策

今後は以下の問題に着目しながら本研究を進めていく予定である.
・人名・時間だけでなく,他の関係史料・地名などの知識についても扱うことで知識表現・各種関連のデザインや蓄積のためのプロトタイプシステムの完成度を高めていく.
・歴史知識等を用いた新たな歴史情報に関する検索手法の確立を進める.
・プロトタイプしたシステムの利用を通じて,史学研究者から率直な意見を収集し,それを分析することでよりよいシステムを構築していく.

次年度使用額が生じた理由

研究を遂行する上で不可欠である消耗品等の支出において予定よりも安価だったため.

次年度使用額の使用計画

次年度使用額としては消耗品費として計上することを予定している.
次年度における主な研究経費はテキスト分析用計算機,消耗品,旅費である.旅費は本研究成果を国内外で発表するために必要である.消耗品費は成果報告における論文別刷,発表における機材調達等のため必要である.テキスト分析を行う上で効率的なアルゴリズムにもとづきプロトタイピングを行うが,実装・実行するためにテキスト分析用計算機が不可欠である.

備考

情報処理学会人文科学とコンピュータ研究会シンポジウムじんもんこん2014ポスター賞受賞(2014年)

  • 研究成果

    (11件)

すべて 2015 2014

すべて 雑誌論文 (8件) (うち謝辞記載あり 6件、 査読あり 4件) 学会発表 (3件) (うち招待講演 3件)

  • [雑誌論文] 地域研究資料と対象とした時空間情報に着目したデータの構造化2015

    • 著者名/発表者名
      山田太造
    • 雑誌名

      人文科学とコンピュータ研究会報告

      巻: 2015-CH-105 ページ: 1-6

    • 謝辞記載あり
  • [雑誌論文] 日本史史料を対象としたテキスト構造化と読解支援2015

    • 著者名/発表者名
      山田太造
    • 雑誌名

      東京大学史料編纂所[共同研究拠点と歴史情報]シンポジウム「資料情報の新たな発信」予稿集

      巻: 2014 ページ: 20-24

  • [雑誌論文] トピックモデルを用いた天正期古記録『上井覚兼日記』における人物間関係の検出2014

    • 著者名/発表者名
      山田太造,野村朋弘,井上聡
    • 雑誌名

      じんもんこん2014論文集

      巻: 2014 ページ: 131-138

    • 査読あり / 謝辞記載あり
  • [雑誌論文] 位置情報とトピックモデルに基づくフィールドノートのビジュアライズ手法2014

    • 著者名/発表者名
      高田百合奈,渡邉英徳,柳澤雅之,山田太造
    • 雑誌名

      じんもんこん2014論文集

      巻: 2014 ページ: 57-62

    • 査読あり / 謝辞記載あり
  • [雑誌論文] 人文科学データベースからの人名一覧表示システムの構築2014

    • 著者名/発表者名
      清野陽一,山田太造,高田智和,古瀬蔵
    • 雑誌名

      人文科学とコンピュータ研究会報告

      巻: 2014-CH-103 ページ: 1-6

  • [雑誌論文] Place Name Extraction from Field Notes Based on Text Analysis for Area Studies2014

    • 著者名/発表者名
      Taizo Yamada
    • 雑誌名

      Proceedings of PNC2014 Annual Conference and Joint Meetings

      巻: 2014 ページ: 55

    • 査読あり / 謝辞記載あり
  • [雑誌論文] A Text Encoding Support System for Pre-modern Japanese Historical Materials2014

    • 著者名/発表者名
      Taizo YAMADA, Satoshi INOUE
    • 雑誌名

      Proceedings of Digital Humanities 2014

      巻: 2014 ページ: 558-559

    • 査読あり / 謝辞記載あり
  • [雑誌論文] 前近代日本史史料をベースとしたテキストデータベースの特徴と課題2014

    • 著者名/発表者名
      山田太造
    • 雑誌名

      日本語学臨時増刊号

      巻: 2014年11月号 ページ: 29-41

    • 謝辞記載あり
  • [学会発表] 歴史学の情報?2015

    • 著者名/発表者名
      山田太造
    • 学会等名
      イベント企画:IPSJ-ONE,情報処理学会第77回全国大会
    • 発表場所
      京都大学百周年時計台記念館百周年記念ホール
    • 年月日
      2015-03-17 – 2015-03-17
    • 招待講演
  • [学会発表] 地域研究データにおけるトピックの検出と時空間変化に関する研究2014

    • 著者名/発表者名
      山田太造
    • 学会等名
      H-GIS研究会
    • 発表場所
      京都大学地域研究統合情報センター
    • 年月日
      2014-10-17 – 2014-10-17
    • 招待講演
  • [学会発表] Text mining for Historical Documents –RDF and Linked Open Data-2014

    • 著者名/発表者名
      Taizo Yamada
    • 学会等名
      Pre-Symposium of Kyoto University ASEAN Center (Bangkok Office) Opening Ceremony and Commemorative Symposium
    • 発表場所
      Grand ballroom, 4th Floor Grand Millennium Sukhumvit, Bankok, Thailand
    • 年月日
      2014-06-27 – 2014-06-27
    • 招待講演

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi