2018 Fiscal Year Research-status Report
Project/Area Number |
18K11990
|
Research Institution | Kyushu University |
Principal Investigator |
中藤 哲也 九州大学, 情報基盤研究開発センター, 助教 (20253502)
|
Co-Investigator(Kenkyū-buntansha) |
廣川 佐千男 九州大学, 情報基盤研究開発センター, 教授 (40126785)
石田 栄美 九州大学, 附属図書館, 准教授 (50364815)
鈴木 孝彦 九州大学, 情報基盤研究開発センター, 准教授 (90243906)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 計量書誌学 / 情報抽出 / 機械学習 / テキストマイニング |
Outline of Annual Research Achievements |
今年度は、学術論文の評価指標に関する研究を中心に推進した。 まず、学術論文の客観的評価に関する研究として、アブストラクトを含む学術論文の書誌情報と該当論文の引用数の関係を分析した。研究対象のデータとして(1)コンピュータサイエンス分野の著名な論文誌及びプロシーディングの計20誌から抽出した38,766件の論文の書誌情報、(2)Bibliometrics(計量書誌学)分野の論文として論文データベースから抽出した10,186件の論文の書誌情報を準備した。これらの論文の書誌情報を素性とした特徴ベクトルを生成し、機械学習によって引用数で論文を分類する分類器を生成した。分類する引用数の閾値を変化させた大量の分類器の性能評価から、書誌情報と引用数に一定の関係が存在することを示した。この情報を用いることで学術論文の適切な選択や、学術論文間の関係抽出の精度を改善できる可能性がある。この点に関する研究を継続中である。 加えて、引用数ではなく引用グループ数を用いた論文評価手法についての研究を行った。上記(2)の10,186件の論文を引用している論文に関して著者グループを構築し、どの著者グループがどの論文を引用しているかについて分析を行い、特定の研究グループによる多数の引用に比べて、多くの研究グループによる引用は該当論文の影響の広さを示す指標となりうることを示した。引用数などの他の評価指標と組み合わせることで、学術論文の多面的な評価を行うことが可能となる。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
論文自体の分析を中心に行った結果、アンケート調査に入れなかったため、やや遅れているとした。
|
Strategy for Future Research Activity |
引き続き、論文自体を分析する研究、分析手法に関する研究、を並行して行って行く。特に、論文の関係を最適にとらえることができる粒度の決定に関しては、各種の言語データに加えて、複数の手法を組み合わせ、高速計算機による大規模計算を行う予定である。また、研究者による論文引用の決め方に関してアンケート分析等を行いながら、そのシステム化を進める。
|
Causes of Carryover |
研究機関の変更予定に伴い、研究機材の購入等を延期したため、その分の費用を繰り越している。
|
Research Products
(5 results)