2017 Fiscal Year Annual Research Report
A Study on Digital Library System for Experimental Information Extraction, Visualization and Recommendation
Project/Area Number |
15H02789
|
Research Institution | National Institute of Informatics |
Principal Investigator |
高須 淳宏 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
|
Co-Investigator(Kenkyū-buntansha) |
正田 備也 長崎大学, 工学研究科, 准教授 (60413928)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 電子図書館 / 情報推薦 |
Outline of Annual Research Achievements |
学術情報からの情報抽出の課題については、平成28年度に引き続きテキスト分析の研究を行った。平成28年度はCRFを用いた情報抽出を行ったが、平成29年度は深層学習を用いた学術文献本文の分析および情報抽出を行い抽出精度の向上をはかった。文献に含まれる実験情報の抽出においては、実験結果をまとめた表の解析に取り組んだ。表は基本的にはn行m列のセルの並びとなるが、複数の行や列にまたがる複合的なセルもある。本研究では、セルの境界を表中のテキストのアライメントに基づいて抽出する方法を考案した。これにより複数行(列)にまたがるセルを含む不定形な表かの情報抽出を可能とした。国際会議ICDARで行われた表理解のコンペティションで作成された評価コーパスを用いて性能評価を行ったところ、考案した手法はコンペティションで最も高い精度を達成した手法と同等の精度を有することを確認した。 情報推薦の研究では、ニューラルモデルを用いた利用者およびアイテムのembedding法について研究を進めた。モデルの学習には一般に大規模な訓練データが必要になるが、システムの利用者から訓練データを収集するのは容易でない。そこで、利用者から比較的容易にデータ収集が可能なシステムの利用ログを併用する方法について検討を進めた。アクセスログ情報をコンテキストとするニューラルネットワークを用いることで情報推薦の精度を高められることを確認した。また、アイテムに関するコンテキストを活用することで、「置き換え可能なアイテム」や「相補的な役割を果たすアイテム」など、アイテム間の詳細な関係を抽出できる可能性があることがわかった。
|
Research Progress Status |
平成29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成29年度が最終年度であるため、記入しない。
|
Research Products
(10 results)