研究課題
本研究は歴史的類推を促進するための学習環境の実現に向けた、過去の出来事を検索するアルゴリズムとシステムを実現することを目的とする。この目的のために今年度は、(1) 効果的な出来事分類器の実現、(2) 潜在意味解析に基づく出来事の検索アルゴリズムの実現、に関する研究を展開した.(1)過去の出来事はわずかな文字数で記述される傾向がある。これまでの短文分類に関する研究は、文脈情報を用いた手法とWikipediaのような外部の情報源を活用して訓練したモデルを転移させる手法が行われてきた。しかし本研究が対象とするような過去の出来事に関する記述は、時系列に列挙されていることや、その出来事の詳細が記述された情報がそもそも存在しない傾向があるので、先行研究が利用している情報を取得できず、高い精度の分類器を構築することが難しい。この問題に対して本研究では一般的な文章分類器で利用される特徴に加えて出来事に着目した特徴を更に用いて分類器を訓練することによって先行手法よりも高い精度が得られることを示した。他にも、一つの教師データに対して複数のカテゴリを付与できる状況において、適切なカテゴリが付与されていないデータが存在しても高い精度で分類できるためのアルゴリズムを実現し、提案手法の有効性を示した。(2)については,(1)で実現した分類器を用いて過去の出来事の各カテゴリへの関連度を計算し、その値を用いてユーザが指定したカテゴリに関連する出来事をランキング形式で出力する検索システムを実現した。このシステムを用いることによって、複数のカテゴリに関連する出来事の一覧を取得することが可能になるので、テストデータセットを作成するときに特に有効である。他にも、異なる年における類似する単語の組みを検索するアルゴリズムを実現し、その有効性を示した。
2: おおむね順調に進展している
本年度の研究では、当初の予定通り、グラフを構築するために利用するデータの収集、グラフの潜在的な意味を分析する際に用いる分類器の実現ができ、これらの成果をECIR等の国際会議に論文が採択されている。また、研究実績の概要の(2)は当初の計画には含まれていなかったが、本研究の有効性を示すために実行する必要が明らかになったので、今年度に着手し、その成果をJCDL等の国際会議に論文が採択されている。以上のことからおおむね順調に進展していると評価することができる.
今後は、グラフに対する潜在的意味解析を行う手法を実現する。また、この手法の性能を評価するために、テストデータセットを作成する。
当初から参加を予定していた国際会議への出張費用を大学の予算で支出できたのが理由である。次年度は,当初の予定には無かった申請者の異動があったので、研究環境を整備するためにワークステーションを購入する。
すべて 2018 2017 その他
すべて 雑誌論文 (7件) (うち査読あり 7件) 学会発表 (1件) 備考 (1件)
In Proceedings of the 18th ACM/IEEE-CS Joint Conference on Digital Libraries
巻: - ページ: 印刷中
In Proceedings of the 40th European Conference on Information Retrieval
巻: - ページ: 729~736
https://doi.org/10.1007/978-3-319-76941-7_69
In Joint Proceedings of the ACM IUI 2018 Workshops co-located with the 23rd ACM Conference on Intelligent User Interfaces ACM IUI 2018
巻: - ページ: -
In Proceedings of the 2nd International Conference on Advanced Wireless Information, Data, and Communication Technologies
In Proceedings of the 9th International ACM Web Science Conference
巻: - ページ: 419~420
10.1145/3091478.3098868
In Proceedings of the Annual International Conference for Media in Education
http://tk2-240-29917.vs.sakura.ne.jp/dataset_creation/category_based_search.php