2022 Fiscal Year Annual Research Report
Cost-Sensitive Information Extraction and Cyber-Physical Browsing Support for Academic Papers
Project/Area Number |
18K11989
|
Research Institution | Okayama University |
Principal Investigator |
太田 学 岡山大学, 自然科学学域, 教授 (10326019)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 電子図書館 / 学術論文 / 情報抽出 / メタデータ / 閲覧支援 / サイバーフィジカル / 表構造解析 |
Outline of Annual Research Achievements |
本研究は、学術論文から様々なメタ情報をコストセンシティブに抽出する方法の確立と、抽出したメタ情報を利用したタブレット端末による新しい論文閲覧スタイルの提案を目的とする。 令和4年度は、学術論文の参考文献欄から書誌情報を抽出するために開発を進めてきたBidirectional Encoder Representations from Transformers(BERT)による参考文献書誌情報抽出器の抽出誤りの自動検出を試み、実験によりその検出の精度ならびに見込まれる修正コストなどを評価した。一方、タブレット端末による論文閲覧支援の一環として、引用意図に基づく引用箇所の補足情報の自動生成手法を改良した。特に初学者の論文閲覧支援のために、引用文献以外の多様な情報源から補足情報の候補を収集して読者に提示する機能を被験者実験用ブラウザに組み込んで評価実験を行い有用な知見を得た。論文閲覧支援ではまた、表中の数値データの自動グラフ変換を行うために、文書から表を自動で検出しその構造を解析するエンドツーエンド表構造解析手法を開発した。これらの研究成果について国内研究会などで7件発表した。 研究期間全体では、学術論文からのコストセンシティブ情報抽出として、BERTを用いた参考文献情報抽出器を開発して実験を行い、その抽出精度と学習データ量(生成コスト)のトレードオフ、ならびにこの抽出誤りの人的修正コストが十分に制御可能である見通しを得た。また論文閲覧支援においては、タブレット端末のカメラを通して紙のフィジカルな学術論文を読む読者に、論文から抽出した引用情報や専門用語などとサイバー空間の関連情報を知的に集約して提供するサイバーフィジカル論文閲覧支援インタフェースを提案した。
|