2021 Fiscal Year Research-status Report
Project/Area Number |
18K11990
|
Research Institution | Nakamura Gakuen College |
Principal Investigator |
中藤 哲也 中村学園大学, 栄養科学部, 准教授 (20253502)
|
Co-Investigator(Kenkyū-buntansha) |
廣川 佐千男 東京都立産業技術大学院大学, 産業技術研究科, 研究員 (40126785)
石田 栄美 九州大学, 附属図書館, 准教授 (50364815)
鈴木 孝彦 九州大学, 情報基盤研究開発センター, 准教授 (90243906)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 計量書誌学 / 情報抽出 / 機械学習 / テキストマイニング |
Outline of Annual Research Achievements |
引き続き、論文の細粒度構造に関する研究・調査を行っている。論文データベースから抽出したこれまでのBibliometrics(計量書誌学)分野の計10,186件の論文の書誌情報データに加え、今年度は新たに助成金【日本国の科学研究費、及びアメリカ合衆国のNational Science Foundation(NSF)】の観点からコンピューターサイエンス(情報工学)分野の論文11年分の書誌情報データ、計75,482件を収集し、分析対象とした。これらの論文リストから論文の本文の情報をできる限り取得し、各論文をセクション単位(基本的にはIMRADに加え、Abstract、Conclusionを想定)のパーツに分割し、それらの内容と引用に関して、統計的性質を明らかにしてきた。また、セクション間の距離を定義することで、論文に記載された関連研究の引用情報から得られる他の論文への論文単位の引用関係から、より詳細なセクション間の関係に詳細化することを試みているところである。セクション間の距離に関しても、基本的なコサイン類似度に加えて、トピック分析や単語の分散表現、ドキュメントの分散表現による計算方法など試みている。より適切な距離を明らかにする予定である。これらの基礎データを元に論文間の意味的な関係を整理・分類することで、単なる引用関係にとどまらない論文間の関係性を自動的に抽出・可視化する仕組みを構築予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
新型コロナ感染症対策のために移動や打ち合わせが制限されたこと、発表の機会が得られなかったこと、新型コロナ感染症に関する対応に要する時間の問題があった事などから、充分な成果発表が出来なかったため、やや遅れているとした。
|
Strategy for Future Research Activity |
これまで収集したデータの整理を完了し、検討済みの複数の評価指標を用いた実験を進め、最終的な結果をまとめる予定である。
|
Causes of Carryover |
新型コロナ感染症の拡大により会議がオンライン開催になったため、予定していた出張がキャンセルとなった。今年度の成果発表に使用する予定である。
|
Research Products
(1 results)