研究課題/領域番号 |
18K11989
|
研究機関 | 岡山大学 |
研究代表者 |
太田 学 岡山大学, 自然科学研究科, 教授 (10326019)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 電子図書館 / 学術論文 / 情報抽出 / メタデータ / 閲覧支援 / サイバーフィジカル |
研究実績の概要 |
本研究は、学術論文の電子文書から様々なメタ情報をコストセンシティブに抽出する方法の確立と、抽出したメタ情報を利用したタブレット端末による新しい論文閲覧スタイルの提案を目的とする。本研究では、機械学習に基づく情報抽出器の精度と学習コストのトレードオフと、抽出誤りに対する人的修正コストを実用レベルで制御することで、コストセンシティブな情報抽出を実現する。さらに、学術論文から抽出した書誌情報、専門用語、実験情報などについてサイバー空間の関連情報を知的に集約し、フィジカルな(紙の)読者に提供するためのサイバーフィジカル論文閲覧支援インタフェースを提案する。 平成30年度は、学術論文の参考文献欄からの書誌情報抽出のため、ニューラルネットワークとConditional random field(CRF)のハイブリッドな抽出器を提案し、これが従来のCRF抽出器と同等以上の性能であることを実験により確認した。また、この従来のCRF抽出器に転移学習を取り入れることで性能が改善されることも確認した。これらの研究成果については国内の研究会とフォーラムで発表した。 一方、タブレット端末による論文閲覧支援のため、論文中の表を構造解析してそのグラフを自動生成する手法を提案した。また、論文中の引用箇所に対して、自動でその最適な被引用文章を被引用文献の論文から抽出して生成する方法を提案した。さらに、開発中の論文閲覧支援機能をもつ学術論文ブラウザのプロトタイプに、備忘録の機能を実装し、被験者実験により評価した。これらの研究成果については国際会議と国内フォーラムで発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
コストセンシティブ情報抽出では、学術論文の参考文献欄からの書誌情報抽出器として、ニューラルネットワークとCRFのハイブリッドな抽出器を提案し、これが従来のCRF抽出器と同等以上に高精度に書誌情報を抽出でき、かつその構築も容易であることを確認した。また従来のCRF抽出器に転移学習が有効であることを実験により確認できた。一方、タブレット端末における学術論文閲覧支援では、論文の表構造解析や引用意図解析の研究で進捗が見られ、閲覧支援機能をもつ学術論文ブラウザの新機能についても検討した。これらの研究成果について、国際会議で2件、国内フォーラムなどで5件発表した。
|
今後の研究の推進方策 |
令和元年度は、参考文献の書誌情報のみならず、表、専門用語など他のメタ情報の抽出器や解析器も合わせて洗練することを検討する。また、サイバーフィジカル論文閲覧支援インタフェースでは、平成30年度に検討した備忘録の実用性を改善して、開発中の学術論文ブラウザのプロトタイプに組み込んでいく。 学術的な成果としては、国際会議発表1回および査読付き論文1報の投稿を計画している。
|
次年度使用額が生じた理由 |
(理由) 平成30年度に予定していた海外での研究成果発表が国内での発表になるなどしたため生じた。 (使用計画) 主に国際会議などにおける研究成果発表の費用として支出する予定である。
|
備考 |
1st Best Conference Paper at MEDES'18, Shunsuke Tanabe, Manabu Ohta, Atsuhiro Takasu, Jun Adachi (2018.9.28). 第11回データ工学と情報マネジメントに関するフォーラム 学生プレゼンテーション賞, 木下諒 (2019.3.5), 岩本拓実 (2019.3.6).
|