研究課題/領域番号 |
23K18506
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分62:応用情報学およびその関連分野
|
研究機関 | 名古屋大学 |
研究代表者 |
松原 茂樹 名古屋大学, 情報基盤センター, 教授 (20303589)
|
研究分担者 |
加藤 芳秀 名古屋大学, 情報連携推進本部, 准教授 (20362220)
中村 剛士 中部大学, 工学部, 教授 (90303693)
|
研究期間 (年度) |
2023-06-30 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2025年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 学術論文 / 自動評価 / 被引用文献 / 研究データ / テキスト解析 |
研究開始時の研究の概要 |
文献の被引用回数は、学術における影響力を示す代表的な指標である。しかし、その影響を適切に評価するには、ある論文で引用された文献が、その論文の産出にどの程度貢献したのかを考慮する必要がある。本研究では、文献の新たな評価法を提起するという動機のもと、論文内の引用文脈の解析可能性と被引用文献の貢献度測定の実現可能性を示すことを目的とする。論文の本体及びメタデータから判定可能な客観的な評価法を開発する。
|
研究実績の概要 |
文献の影響力を適切に評価するには、ある論文においてその文献が引用されたか否かだけでなく、その論文の産出にどの程度その文献が貢献したのかに基づく必要がある。本研究では、論文内の引用箇所の周辺テキストの解析可能性と被引用文献の貢献度測定の実現可能性を示すことを目的とする。そのために初年度は、本研究全体を支える学術資源の整備を進めるともに、(1)論文における文献引用の機能を識別する方式の開発、及び、(2)学術論文における被引用文献の重要度の評価方式の開発、の研究を推進した。 (1)学術論文間の関係性は引用を通じて確立される。論文に関連する文献を発見するために、論文間の関係を引用の機能でラベル付けすることが有望である。本研究では、引用段落のテキストに基づいて引用の機能を自動的に特定するモデルを開発した。本モデルは、SciBERTなどの大規模言語モデルを利用して引用機能を特定する。言語モデルは入力トークン数に制限があり、引用段落全体を一度に処理することができないという問題に対処するため、引用段落における引用機能の分布を調査し、引用機能を特定する際の着目点を定めた。論文データを用いた実験により本モデルの有効性を実証した。 (2)論文が持つ真の影響力を測るためには、論文において引用されている文献のうち、重要な引用をそうでない引用と区別して扱うことが考えられる。本研究では、学術論文における被引用文献の重要度を引用文脈を用いて評価する手法を開発した。本手法では、引用箇所を含む文(以下、引用文)のテキスト情報を引用文脈として利用する。引用文に含まれる被引用文献に関わる記述を検出し、その情報を重要度の評価に用いる。論文データを用いた実験により、引用された文献に関わる記述の情報が重要度評価に有用であることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
プロジェクトの初年度は、本研究で活用する学術資源を整備するともに、論文における文献引用の機能の識別、論文における被引用文献の重要性の判定を試みることを計画をしていたのに対し、引用目的の同定モデル、ならびに、引用文献が重要か否かの判別モデルに関して取り組み、いくつかの成果を得ることができた。得られた知見を査読付き論文として国際会議で公表したほか、引用目的の同定に関わる共通タスクに取り組む国際ワークショップで最高位の性能を記すに至っており、本課題はおおむね順調に進展しているといえる。
|
今後の研究の推進方策 |
次年度は二年目として、本研究で活用する論文テキスト資源の拡充を引き続き進める。また、大規模言語モデルを用いた引用テキスト解析に取り組むことにより、前年度に試みた引用文献の重要度の評価性能、及び、引用目的の識別性能の向上を目指す。研究推進上の致命的な問題は生じておらず、当初の研究計画を大きく変更する必要はない。
|