研究実績の概要 |
各種論文データベースから抽出した学術論文を対象に分析を進めている。論文データベースによる違いも分析対象とするために、複数の論文データベースを利用している。対象とした論文は、PLOS ONEから収集した論文182,102件、Elsevier(エルゼビア)が提供する論文情報データベースSCOPUSから抽出したBibliometrics(計量書誌学)分野の計10,186件の論文、助成金【日本国の科学研究費、及びアメリカ合衆国のNational Science Foundation(NSF)】の観点からコンピューターサイエンス(情報工学)分野の11年分の論文計75,482件、PubMedより抽出した1975年から2024年までの遠隔医療に関する論文116,740件である。これらの論文の書誌情報を取得し、アブストラクトを含む書誌情報に関する分析に加えて、オンラインで本文が取得可能な論文に関して本文を取得し、自サーバー内データベースに蓄積した。各論文をセクション単位(基本的にはIMRADに加え、Abstract、Conclusionを想定)のパーツに分割し、それらの内容と引用に関して、統計的性質を分析している。また、セクション間の距離を定義することで、論文に記載された関連研究の引用情報から得られる他の論文への論文単位の引用関係から、より詳細なセクション間の関係に詳細化することを試みている。セクション間の距離に関しては、基本的なコサイン類似度に加えて、トピック分析による分類、単語やドキュメントの分散表現による計算方法などから適切な手法をまとめている。これらの基礎データを元に論文間の意味的な関係を整理・分類することで、単なる引用関係にとどまらない論文間の関係性を自動的に抽出・可視化する仕組みを構築中である。
|