研究課題/領域番号 |
18K11990
|
研究機関 | 中村学園大学 |
研究代表者 |
中藤 哲也 中村学園大学, 栄養科学部, 准教授 (20253502)
|
研究分担者 |
廣川 佐千男 東京都立産業技術大学院大学, 産業技術研究科, 研究員 (40126785)
石田 栄美 九州大学, 附属図書館, 准教授 (50364815)
鈴木 孝彦 九州大学, 情報基盤研究開発センター, 准教授 (90243906)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | 計量書誌学 / 情報抽出 / 機械学習 / テキストマイニング |
研究実績の概要 |
引き続き、論文の細粒度構造に関する研究・調査を行っている。論文データベースから抽出したこれまでのBibliometrics(計量書誌学)分野の計10,186件の論文の書誌情報データに加え、今年度は新たに助成金【日本国の科学研究費、及びアメリカ合衆国のNational Science Foundation(NSF)】の観点からコンピューターサイエンス(情報工学)分野の論文11年分の書誌情報データ、計75,482件を収集し、分析対象とした。これらの論文リストから論文の本文の情報をできる限り取得し、各論文をセクション単位(基本的にはIMRADに加え、Abstract、Conclusionを想定)のパーツに分割し、それらの内容と引用に関して、統計的性質を明らかにしてきた。また、セクション間の距離を定義することで、論文に記載された関連研究の引用情報から得られる他の論文への論文単位の引用関係から、より詳細なセクション間の関係に詳細化することを試みているところである。セクション間の距離に関しても、基本的なコサイン類似度に加えて、トピック分析や単語の分散表現、ドキュメントの分散表現による計算方法など試みている。より適切な距離を明らかにする予定である。これらの基礎データを元に論文間の意味的な関係を整理・分類することで、単なる引用関係にとどまらない論文間の関係性を自動的に抽出・可視化する仕組みを構築予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
新型コロナ感染症対策のために移動や打ち合わせが制限されたこと、発表の機会が得られなかったこと、新型コロナ感染症に関する対応に要する時間の問題があった事などから、充分な成果発表が出来なかったため、やや遅れているとした。
|
今後の研究の推進方策 |
これまで収集したデータの整理を完了し、検討済みの複数の評価指標を用いた実験を進め、最終的な結果をまとめる予定である。
|
次年度使用額が生じた理由 |
新型コロナ感染症の拡大により会議がオンライン開催になったため、予定していた出張がキャンセルとなった。今年度の成果発表に使用する予定である。
|