2016 Fiscal Year Annual Research Report
Study on Implementation of a Scholarly Document Analysis System and New Digital Library Services
Project/Area Number |
25330384
|
Research Institution | Okayama University |
Principal Investigator |
太田 学 岡山大学, 自然科学研究科, 教授 (10326019)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 電子図書館 / 文書解析 / 情報抽出 / メタデータ / CRF / ウェブ / 電子書籍 / 閲覧支援 |
Outline of Annual Research Achievements |
本研究では、学術論文から書誌情報、図表、節題、専門用語など様々なメタ情報を抽出し、他のデータベースと付き合わせて同定を行うための論文文書解析システムを提案した。また、抽出したメタ情報を利用した新しい電子図書館サービスについて検討し、タブレット端末による学術論文のオンライン閲覧の利便性を向上させるインタフェースを提案した。 論文文書解析システムでは、条件付確率場(CRF)などの機械学習を駆使してメタ情報を高精度かつ低コストで抽出する抽出器を実装した。特にCRFによる書誌情報抽出では、高精度な抽出に出版社リストなどの辞書が有効であることを実験により確認した。また能動学習と転移学習によりこのCRF抽出器の学習データが削減できることを示し、これにより書誌情報抽出の低コスト化の見通しを得た。これらの成果について国際会議や国内フォーラムなどで発表した。 新たな電子図書館サービスとして、タブレット端末で使用でき様々な閲覧支援機能をもつ論文ブラウザのプロトタイプを実装した。この論文ブラウザでは、読者が任意に選択した論文中の用語のWikipedia記事などの関連情報や、論文から抽出した重要語と著者が論文に付した著者キーワードの関連などを見ながら論文を読むことができる。さらに、文献の引用意図を解析して閲覧支援に利用するために、論文中の引用箇所の引用意図を分類する方法を提案し、実験により評価した。これらの成果については国際会議や国内研究会で発表した。
|
Research Products
(5 results)