2020 Fiscal Year Annual Research Report
専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの研究
Project/Area Number |
19K22888
|
Research Institution | Hokkaido University |
Principal Investigator |
吉岡 真治 北海道大学, 情報科学研究院, 教授 (40290879)
|
Co-Investigator(Kenkyū-buntansha) |
原 真二郎 北海道大学, 量子集積エレクトロニクス研究センター, 准教授 (50374616)
鈴木 晃 国立研究開発法人物質・材料研究機構, 統合型材料開発・情報基盤部門, NIMS特別研究員 (50799723)
|
Project Period (FY) |
2019-06-28 – 2021-03-31
|
Keywords | 論文データベース / テキストマイニング |
Outline of Annual Research Achievements |
本研究では、論文からの情報抽出・知識発見を支援するための専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの提案を目指している。このシステムでは、分野の研究者が興味を持つ最新の論文を含むデータベースをPDF 解析技術を用いて構築すると共に、そこからの用語辞書を作成する枠組を提供することによって、ユーザが継続的に専門用語に関する知識保全を行うエコシステム(生態系)を構築する方法を提案している。 2020年度は、昨年度作成した用語辞書管理システムを用いて、実際に分野の専門家から収集した論文集からの専門用語候補の生成と、その登録作業を行うとともに、この用語辞書管理システムの登録結果を用いて、論文・図表を検索するシステムを構築し、具体的な論文分析を行える環境を整備した。また、論文中に現れる専門用語の発生頻度に注目して、研究動向を分析するシステムを合わせて提供することで、用語辞書の作成コストをかけた対価に相当するシステムによる支援機能を充実させた。この用語登録のプロセスの中で、複数の役割で用いられる可能性のある用語が登録されたが、パターンマッチで用語を抽出する場合には、その役割の区別ができないために、複数の役割に同じ単語が表示され、冗長な印象を与えるといったシステム運用上の問題も明らかとなってきた。今後は、作成したシステムを基盤として用いることにより、継続的に論文を追加しながら実運用を行なっていく予定である。この活動の中で、本研究の提案による用語辞書のメンテナンスを行なっていき、より良いエコシステムをもつシステムへの発展へとつなげていく予定である。本システムについては、応用先の専門家の集まりである応用物理学会のセッションでの発表を行うなど、この新しい考え方について、分野の専門家から意見をいただく機会も設けている。
|
Research Products
(6 results)