2021 Fiscal Year Research-status Report
作られる物と使われる物が記述された大規模文書群の検索に関する研究
Project/Area Number |
18K11986
|
Research Institution | Gunma University |
Principal Investigator |
安川 美智子 群馬大学, 情報学部, 助教 (70361384)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 情報検索 / 情報組織化 / 情報資源の構築・管理 / 自然言語処理 / データベース |
Outline of Annual Research Achievements |
2021年度の研究では、日本国内の大学等において他者より優れた業績のある研究者を調査することを動機として、特に、「論文の著者」および「書籍(教科書・参考書)の著者」という観点から研究者情報の検索を行う手法について検討した。このような研究者情報の検索に利用可能なオープンデータが国立情報学研究所(NII)等の研究機関から提供されている一方で、有効性の高い情報検索手法は十分に検討されているとは言えない状況である。本研究では、データベースの降順ソート・昇順ソートなどを用いた従来型の単純な検索手法では対象データの特性上、検索がうまく行えない場合をターゲットとして、他者を超越する研究者をその他大勢の研究者から分離・識別するデータベース検索手法を考案した。提案手法は、複数データベースのクロスサーチにスカイライン演算を適用するものであり、数値属性に外れ値が含まれ、かつ、変数間に負の相関がある場合に有効な手法である。2021年度の研究では、科研費データベースKAKENと大学図書館の蔵書データベースCiNii Booksの2つのデータベースに含まれる研究者の業績に関する数値的な属性(「論文や著書の執筆数」、および、「予算の獲得数や獲得総額」)を用いて、科学研究や大学教育に対する研究者の影響力の大きさを定量的に比較するデータ実験を行い、得られた知見を、国際会議 International Conference on Data Science and Institutional Research(DSIR2021)で口頭発表した。また、2021年度の研究では、2022年度の研究の準備として、異なる性質の多様な特徴量が混在した複数のデータベースのクロスサーチについても検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画の通り、2021年度までの研究開発を遂行することができている。また、最終年度に取り組む技術課題についても、2021年度の後半にすでに予備的な考察を行っている。研究の実施によって得られた知見の成果発表も進めており、本研究課題はおおむね順調に進展していると言える。
|
Strategy for Future Research Activity |
これまでの研究では、「食と調理に関する情報検索」および、「大学の教育と研究に関する情報検索」の観点から、数値データが属性情報として関連づけられているテキストデータの検索に焦点を当ててきた。今後の研究では、これまでに研究・開発してきた情報検索手法を、類似の性質を持つ他の構造化データに適用できるかどうかについても検討していきたいと考えている。
|
Research Products
(2 results)