2017 Fiscal Year Research-status Report
Project/Area Number |
17K12792
|
Research Institution | Tokyo University of Science |
Principal Investigator |
澄川 靖信 東京理科大学, 理工学部情報科学科, 助教 (70756303)
|
Project Period (FY) |
2017-04-01 – 2019-03-31
|
Keywords | 計算論的歴史学 / 文章分類器 / 情報検索 |
Outline of Annual Research Achievements |
本研究は歴史的類推を促進するための学習環境の実現に向けた、過去の出来事を検索するアルゴリズムとシステムを実現することを目的とする。この目的のために今年度は、(1) 効果的な出来事分類器の実現、(2) 潜在意味解析に基づく出来事の検索アルゴリズムの実現、に関する研究を展開した.
(1)過去の出来事はわずかな文字数で記述される傾向がある。これまでの短文分類に関する研究は、文脈情報を用いた手法とWikipediaのような外部の情報源を活用して訓練したモデルを転移させる手法が行われてきた。しかし本研究が対象とするような過去の出来事に関する記述は、時系列に列挙されていることや、その出来事の詳細が記述された情報がそもそも存在しない傾向があるので、先行研究が利用している情報を取得できず、高い精度の分類器を構築することが難しい。この問題に対して本研究では一般的な文章分類器で利用される特徴に加えて出来事に着目した特徴を更に用いて分類器を訓練することによって先行手法よりも高い精度が得られることを示した。他にも、一つの教師データに対して複数のカテゴリを付与できる状況において、適切なカテゴリが付与されていないデータが存在しても高い精度で分類できるためのアルゴリズムを実現し、提案手法の有効性を示した。
(2)については,(1)で実現した分類器を用いて過去の出来事の各カテゴリへの関連度を計算し、その値を用いてユーザが指定したカテゴリに関連する出来事をランキング形式で出力する検索システムを実現した。このシステムを用いることによって、複数のカテゴリに関連する出来事の一覧を取得することが可能になるので、テストデータセットを作成するときに特に有効である。他にも、異なる年における類似する単語の組みを検索するアルゴリズムを実現し、その有効性を示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度の研究では、当初の予定通り、グラフを構築するために利用するデータの収集、グラフの潜在的な意味を分析する際に用いる分類器の実現ができ、これらの成果をECIR等の国際会議に論文が採択されている。
また、研究実績の概要の(2)は当初の計画には含まれていなかったが、本研究の有効性を示すために実行する必要が明らかになったので、今年度に着手し、その成果をJCDL等の国際会議に論文が採択されている。
以上のことからおおむね順調に進展していると評価することができる.
|
Strategy for Future Research Activity |
今後は、グラフに対する潜在的意味解析を行う手法を実現する。また、この手法の性能を評価するために、テストデータセットを作成する。
|
Causes of Carryover |
当初から参加を予定していた国際会議への出張費用を大学の予算で支出できたのが理由である。 次年度は,当初の予定には無かった申請者の異動があったので、研究環境を整備するためにワークステーションを購入する。
|