2019 Fiscal Year Research-status Report
長期的な因果関係に基づく類似出来事の検出に関する研究
Project/Area Number |
19K20631
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
澄川 靖信 首都大学東京, 大学教育センター, 助教 (70756303)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 計算論的歴史学 / データ分析 / 特徴抽出 / 文章分類 |
Outline of Annual Research Achievements |
本研究は歴史的類推を促進するための学習環境の実現に向けた、長期的な因果関係を表す複数の出来事全体を考慮した類似度測定尺度を利用する検索エンジンを実現することを目的とする。この目的のために今年度は、(1)歴史の教科書、(2)新聞記事、の2つの情報源に記載されている過去の出来事の分析研究を展開した。
(1)歴史の教科書には、関連する出来事が一つの節や章にまとめて記載されている傾向があり、それらの記述や因果関係の妥当性は専門家によって検証されている。本研究では、それらの記述を取り出し、どのような出来事があるのか、どのように分類できるのか、年代別・地域別に分けて生じた出来事数の分布がどのようになっているのか、の観点で分析した。更に、これらの分析結果を検索エンジンや分類器の訓練のために利用する際に、どのような注意が必要なのかを明らかにするためにデータセットの統計情報も分析した。この結果を学術的な有益性を議論した成果を国際論文誌で発表した。
(2)歴史の教科書は複数の出来事の関係性が比較的わかりやすく説明されているものの、個々の出来事の説明量は十分ではなく、検索エンジンの実現のためには他の情報源も利用しなければいけないことが上記の研究を通して明らかになった。この結果を踏まえ、一つの出来事を十分な分量で説明している新聞記事を用いて、どのように特徴ベクトルを設計すれば十分な精度の分類器を訓練できるのかを調査した。この研究では、特徴抽出で広く使われているTF-IDFや潜在意味解析に加えて、過去の出来事を記述する文章の特徴を考慮した手法を実現することによって従来手法よりも分類器の精度が良いことを示した。この成果は図書館情報学のトップジャーナルである国際論文誌IJDLに採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度の研究では、当初の予定通り、長期的な因果関係を構成する過去の出来事の分析を行い、その成果が国際論文誌に採択されている。この実績からおおむね順調に進展していると評価できる。
|
Strategy for Future Research Activity |
今後は、長期的な因果関係を表すグラフ上で類似度を評価するアルゴリズムの開発に着手する。
|
Causes of Carryover |
データ分析のために電子データを購入する予定だったが、利用できるオープンアクセスデータ数の増加によって当初の予定よりも必要な資金が少なく済んだこと、コロナウィルスの影響によって2~3月に予定していた出張が不可能になったので旅費を計上できなかったのが主な理由である。
次年度は開発するアルゴリズムの性能評価を行う必要があるので、ワークステーションなどの機材の購入を検討している。
|
Research Products
(5 results)