研究課題/領域番号 |
19K22888
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分62:応用情報学およびその関連分野
|
研究機関 | 北海道大学 |
研究代表者 |
吉岡 真治 北海道大学, 情報科学研究院, 教授 (40290879)
|
研究分担者 |
原 真二郎 北海道大学, 量子集積エレクトロニクス研究センター, 准教授 (50374616)
鈴木 晃 国立研究開発法人物質・材料研究機構, 統合型材料開発・情報基盤部門, NIMS特別研究員 (50799723)
|
研究期間 (年度) |
2019-06-28 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2020年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2019年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
|
キーワード | 論文データベース / テキストマイニング |
研究開始時の研究の概要 |
本研究では、論文からの情報抽出・知識発見を支援するための専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBを提案する。このシステムでは、分野の研究者が興味を持つ最新の論文を含むデータベースをPDF 解析技術を用いて構築すると共に、これらの分析に利用する情報抽出に利用可能な概念辞書の内容の更新や訓練データを作成する枠組を提供することによって、ユーザが継続的に専門用語に関する知識保全を行うエコシステム(生態系)を構築する方法を提案する。本手法により、特定分野の研究者は、直接的に、その知識保全の効能を享受することが出来るため、知識提供の強い動機付けになることが期待される。
|
研究成果の概要 |
本研究では、論文からの情報抽出・知識発見を支援するための専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表データベース(DB)の提案を目指している。本研究では、分野の研究者が興味を持つ最新の論文を含むデータベースをPDF 解析技術を用いて構築すると共に、そこからの用語辞書を作成する枠組を提供することによって、ユーザが継続的に専門用語に関する知識保全を行うエコシステム(生態系)を持つ論文・図表DBを提案し、実際の論文からDBを構築し、評価を行なった。今後は、作成したシステムを基盤として用いることにより、継続的に論文を追加しながら実運用を行なっていく予定である。
|
研究成果の学術的意義や社会的意義 |
本研究は、論文データの活用方法として、大規模なデータベースを構築するのではなく、特定の研究グループが注目する論文に限定して網羅的に収集したデータベースを構築することにより、研究活動に役立つデータベースの提案を行なっている。利用者は、分析に有用な用語の定義を行うことにより、研究グループによりカスタマイズされた分析が行えるだけでなく、興味のある研究分野での研究動向分析が行えるといった支援も可能となる。このように情報科学の研究者と分野の研究者が共同で問題に取り組む枠組みを構築することは、異分野協同研究を進めるという学術的意義だけでなく、新たな論文データ活用方法の提案という社会的意義も大きい。
|