研究課題/領域番号 |
19K22888
|
研究機関 | 北海道大学 |
研究代表者 |
吉岡 真治 北海道大学, 情報科学研究院, 教授 (40290879)
|
研究分担者 |
原 真二郎 北海道大学, 量子集積エレクトロニクス研究センター, 准教授 (50374616)
鈴木 晃 国立研究開発法人物質・材料研究機構, 統合型材料開発・情報基盤部門, NIMS特別研究員 (50799723)
|
研究期間 (年度) |
2019-06-28 – 2021-03-31
|
キーワード | 論文データベース / テキストマイニング |
研究実績の概要 |
本研究では、論文からの情報抽出・知識発見を支援するための専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの提案を目指している。このシステムでは、分野の研究者が興味を持つ最新の論文を含むデータベースをPDF 解析技術を用いて構築すると共に、これらの分析に利用する情報抽出に利用可能な概念辞書の内容の更新や訓練データを作成する枠組を提供することによって、ユーザが継続的に専門用語に関する知識保全を行うエコシステム(生態系)を構築する方法を提案している。本研究では、この枠組について、申請者でシステム開発を担当する吉岡と、分担者で分野の専門家であり、このシステムを利用する立場である原・鈴木らと意見交換を行っている。以前に類似のシステムを作成した際には、専門用語の収集を支援するためのユーザインターフェースが貧弱だったために、専門用語辞書の構築に非常に手間取るといった問題があったため、本研究では、まず、この専門用語辞書の構築を支援するための用語辞書管理システムの構築が不可欠であった。そのため、本年度は、この用語辞書管理システムについて要求仕様の検討を行うと共にソフトウェア開発を行なった。このシステムを用いることにより、論文データの収集から、専門用語辞書の構築という、最初の流れが、これまでよりもスムーズに行われることが期待されるため、2020年度からの実験に向けての準備が整ったと考えている。また、応用先の専門家の集まりである応用物理学会のセッションでの発表を行うなど、この新しい考え方について、分野の専門家から意見をいただく機会も設けている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度は、2020年度に行う実際の分野の専門家の所属する研究室での実運用を目指して、そのためのデータを容易に扱うことができるシステムの構築を目指すと共に、今後の研究の方向性についての議論を行うという点にあった。現在、これまでにデータ収集の支援が不十分であったために、データの入力に手間取っていた用語辞書の登録システムについてシステム開発が終わったことで、論文データの収集→用語辞書の作成というプロセスを始める準備が出来た。これらのシステムを用いて2020年度の実運用を目指すことが出来ることから、概ね、順調に進展していると判断した。
|
今後の研究の推進方策 |
2020年度は、実運用を行うためのデータの整備を行い、実際の研究活動への適用を目指している。ただ、コロナウイルスの感染拡大に伴う影響により、データ作成などの作業が少し遅れることが懸念材料である。リモートで出来る作業や作業日程の再検討などを含めて、この特殊事態への対応を検討していきたい。
|
次年度使用額が生じた理由 |
年度後半に予定していた会議への出張などが新型コロナウイルスの影響もあり中止やリモート開催に変更となり、予定していた予算の執行が行えなかった。旅費については、本年度も同じような状況が続くことが想定されるため、このような経費については、データ作成のための人件費やデータベースシステムを運用するための計算機の増強などに振り分けることで、より良い最終的な研究成果を得るための執行を行う予定である。
|