2014 Fiscal Year Research-status Report
テキストマイニング分析による史学的知識抽出に関する研究
Project/Area Number |
26730167
|
Research Institution | The University of Tokyo |
Principal Investigator |
山田 太造 東京大学, 史料編纂所, 助教 (70413937)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 歴史情報 / 日本史 / テキストマイニング / 情報検索 / メタデータ |
Outline of Annual Research Achievements |
本研究では日本史学研究における研究過程支援のため,史料目録・テキストから史学的知識を抽出し,知識間・知識-史料間・史料間などの関係を明確にしながら,内在する史学的知識・暗黙知を外在化する研究を行うため,特に(1)史学的知識の抽出・蓄積,(2)史学的知識間,史学的知識-史料間,史料間の関連性の検出,(3)知識表現・関連表現とそれらを用いた検索手法の確立を解決する. 平成26年度は,史学研究者が研究過程で蓄積している史学的知識,特に天正記の史料を用いて人名・時間に着目し,調査・分析を進め,分析の結果に基づき,知識および各種関連の表現方法,さらに蓄積方法を提案するため,上記の(1)および(3)についてデザインし,プロトタイピングを進めた. これにより,ある人物を時系列に追跡し,人名間の関係を提示するなどの日本史における人名に関するテキストマイニングの実現を進めた. 最初の段階であるため,人名・時間に特化してシステムのプロトタイピングしテキストマイニングの結果を分析した.しかしながら,他の知識については扱っていないため,知識表現・各種関連のデザインや蓄積のためのプロトタイプシステムの完成度は低くく,上記の(3) における検索手法としては,十分な機能を持ち合わせていないと考えられる.この後,史学研究者から初期段階でのプロトタイプの利用を通じた率直な意見を収集し,それを分析することでよりよいシステムを構築していくことができると考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
天正記の史料を用いて人名・時間に着目し,調査・分析を進め,分析の結果に基づき,知識および各種関連の表現方法,さらに蓄積方法を提案するため,史学的知識の抽出・蓄積,知識表現・関連表現についてデザインし,プロトタイピングを進めた. 人物を時系列に追跡し,人名間の関係を提示するなどの日本史における人名に関するテキストマイニングの実現を進めた.
|
Strategy for Future Research Activity |
今後は以下の問題に着目しながら本研究を進めていく予定である. ・人名・時間だけでなく,他の関係史料・地名などの知識についても扱うことで知識表現・各種関連のデザインや蓄積のためのプロトタイプシステムの完成度を高めていく. ・歴史知識等を用いた新たな歴史情報に関する検索手法の確立を進める. ・プロトタイプしたシステムの利用を通じて,史学研究者から率直な意見を収集し,それを分析することでよりよいシステムを構築していく.
|
Causes of Carryover |
研究を遂行する上で不可欠である消耗品等の支出において予定よりも安価だったため.
|
Expenditure Plan for Carryover Budget |
次年度使用額としては消耗品費として計上することを予定している. 次年度における主な研究経費はテキスト分析用計算機,消耗品,旅費である.旅費は本研究成果を国内外で発表するために必要である.消耗品費は成果報告における論文別刷,発表における機材調達等のため必要である.テキスト分析を行う上で効率的なアルゴリズムにもとづきプロトタイピングを行うが,実装・実行するためにテキスト分析用計算機が不可欠である.
|
Remarks |
情報処理学会人文科学とコンピュータ研究会シンポジウムじんもんこん2014ポスター賞受賞(2014年)
|