研究課題/領域番号 |
19K20631
|
研究機関 | 首都大学東京 |
研究代表者 |
澄川 靖信 首都大学東京, 大学教育センター, 助教 (70756303)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 計算論的歴史学 / データ分析 / 特徴抽出 / 文章分類 |
研究実績の概要 |
本研究は歴史的類推を促進するための学習環境の実現に向けた、長期的な因果関係を表す複数の出来事全体を考慮した類似度測定尺度を利用する検索エンジンを実現することを目的とする。この目的のために今年度は、(1)歴史の教科書、(2)新聞記事、の2つの情報源に記載されている過去の出来事の分析研究を展開した。
(1)歴史の教科書には、関連する出来事が一つの節や章にまとめて記載されている傾向があり、それらの記述や因果関係の妥当性は専門家によって検証されている。本研究では、それらの記述を取り出し、どのような出来事があるのか、どのように分類できるのか、年代別・地域別に分けて生じた出来事数の分布がどのようになっているのか、の観点で分析した。更に、これらの分析結果を検索エンジンや分類器の訓練のために利用する際に、どのような注意が必要なのかを明らかにするためにデータセットの統計情報も分析した。この結果を学術的な有益性を議論した成果を国際論文誌で発表した。
(2)歴史の教科書は複数の出来事の関係性が比較的わかりやすく説明されているものの、個々の出来事の説明量は十分ではなく、検索エンジンの実現のためには他の情報源も利用しなければいけないことが上記の研究を通して明らかになった。この結果を踏まえ、一つの出来事を十分な分量で説明している新聞記事を用いて、どのように特徴ベクトルを設計すれば十分な精度の分類器を訓練できるのかを調査した。この研究では、特徴抽出で広く使われているTF-IDFや潜在意味解析に加えて、過去の出来事を記述する文章の特徴を考慮した手法を実現することによって従来手法よりも分類器の精度が良いことを示した。この成果は図書館情報学のトップジャーナルである国際論文誌IJDLに採択された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の研究では、当初の予定通り、長期的な因果関係を構成する過去の出来事の分析を行い、その成果が国際論文誌に採択されている。この実績からおおむね順調に進展していると評価できる。
|
今後の研究の推進方策 |
今後は、長期的な因果関係を表すグラフ上で類似度を評価するアルゴリズムの開発に着手する。
|
次年度使用額が生じた理由 |
データ分析のために電子データを購入する予定だったが、利用できるオープンアクセスデータ数の増加によって当初の予定よりも必要な資金が少なく済んだこと、コロナウィルスの影響によって2~3月に予定していた出張が不可能になったので旅費を計上できなかったのが主な理由である。
次年度は開発するアルゴリズムの性能評価を行う必要があるので、ワークステーションなどの機材の購入を検討している。
|