本研究では,電子テキスト化された古典資料(『吾妻鏡』などの平安時代~鎌倉時代に書かれた資料)に対してテキストマイニングを行うことにより人物や地名などの情報の抽出を行い,それらの分析をし,その結果の可視化を行う. 本手法では古典資料に対してテキストマイニングを行うために,サポートベクターマシンによる機械学習を行うことにより,古文の重要語抽出器の作成を行っている.平成27年度では,この重要語抽出器の精度の向上を図り,一定の成果が得られた。また,抽出した重要語の分類を試みており,これについては次年度においても取り組む予定である.さらに,古典資料(『東大寺要録』)に対する注釈付与において,抽出した重要語を新たな注釈候補として推薦するという応用を行った. 平成28年度は、上記の古文の重要語抽出器の精度の向上のため、その学習の基礎となる古文単語基礎データの作成を行った.歴史学研究の基礎資料の一つである,芳賀矢一『日本人名辞典』からの歴史人物情報の抽出を行うことにより,古文単語基礎データの充実を図った.『日本人名辞典』には,歴史上の人物の簡単解説が記述されており,この記述を解析することにより,職業や官職名などの当時の名称を取得することができる.また,それにより歴史上の人物どうしの関係性もより正確に取得することが可能である.なお,この作業は一定の成果が得られているが,まだ完了していない部分も残っており,今後も引き続き研究を継続する予定である.
|