2016 Fiscal Year Research-status Report
テキストマイニング分析による史学的知識抽出に関する研究
Project/Area Number |
26730167
|
Research Institution | The University of Tokyo |
Principal Investigator |
山田 太造 東京大学, 史料編纂所, 助教 (70413937)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 歴史情報 / 日本史 / テキストマイニング / セマンティックウェブ / 情報検索 / メタデータ / 日本史史料 |
Outline of Annual Research Achievements |
本研究では日本史学研究における研究過程支援のため,史料目録・テキスト等から史学的知識を抽出し,知識間・知識ー史料間・史料間などの関係を明確にしながら,内在する史学的知識・暗黙知を外在化する研究を行うため,特に(1)史学的知識の抽出・蓄積,(2)史学的知識間,史料学的知識ー史料間,史料間の関連性の検出,(3)知識表現・関連表現とそれらを用いた検索手法の確立を解決する. 平成27年度までに史学研究者が研究過程で蓄積してきた史学的知識,特に人名および時間に着目した調査・分析を進め,それを深化させてきた.(1)および(3)について古記録等のテキストや家系図類や任免記録類も対象として人名およびそれに関連する史学的知識の蓄積し,セマンティックウェブの技術を応用しながらデザインを進めてきた. 平成28年度は,(1)について天正期以外へ適用するなどによりさらに深化させた.さらに,これまで進めてきたセマンティックウェブ技術,具体的にはRDFを用いた知識表現およびその蓄積方法を適用し,蓄積してきた人名の関連を抽出してきた.(3)については蓄積した史学的知識に対するセマンティックウェブ技術を用いた検索方式,具体的にはSPARQLを用いた検索手法を提案し,さらにそれをプロトタイピングしたウェブシステム上にて適用するなど,さらなる深化に努めた.(2)について,時代・性格の異なる史料群を対象とすることで知識等の関連の検出するため,系図類や任免記録等のを史学研究者とともに性格や史学研究における利用等について洗い出しを行い,史料ー史学的知識間の関連について検討を進めた. これまでの研究成果を人文科学とコンピュータシンポジウム「じんもんこん2016」や国際会議Digital Humanities 2016などで発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
天正期の古記録テキストや系図・任免記録等から抽出した史学的知識の蓄積について国際会議で報告を行い,セマンティックウェブ技術を応用した検索方式およびそれを実現していくためのプロトタイプシステムについてもシンポジウム等で報告を行っており,これまでに進めてきた研究について着々と成果をあげていると考えている.また,これまでは人名に特化した史学的知識を対象として研究を進めてきたが,史料ー史学的知識間についても検討をすすめることができた.これらにより順調に進展することができた.
|
Strategy for Future Research Activity |
今後は以下の問題に着目しながら本研究をさらに進展していく予定である. ・対象史料の拡大をさらに図ることで,他の時代・性格の史料への適用可能性について探る. ・史学的知識において,人名のみならず地名等への適用を検討する ・史学的知識間,史学的知識ー史料間の関連を用いて,史料間の関連を見出していく. 本研究は最終年度であることから,本研究を取りまとめていく.
|
Causes of Carryover |
該当年度における研究報告のために計上していた旅費が予定よりも少ない執行金額で終えたため.
|
Expenditure Plan for Carryover Budget |
次年度使用額として,ハードディスク等の記録媒体などの消耗品もしくは旅費として計上する予定である.テキスト分析を進める上で記憶領域を膨大に消費するため,記憶媒体の導入は不可欠である.また,研究会・学会等での研究報告のため旅費は欠くことができない.
|
Research Products
(19 results)