| 研究課題/領域番号 |
23K18506
|
| 研究種目 |
挑戦的研究(萌芽)
|
| 配分区分 | 基金 |
| 審査区分 |
中区分62:応用情報学およびその関連分野
|
| 研究機関 | 名古屋大学 |
研究代表者 |
松原 茂樹 名古屋大学, 情報基盤センター, 教授 (20303589)
|
| 研究分担者 |
加藤 芳秀 名古屋大学, 情報連携推進本部, 准教授 (20362220)
中村 剛士 中部大学, 工学部, 教授 (90303693)
|
| 研究期間 (年度) |
2023-06-30 – 2026-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2025年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
| キーワード | 学術論文 / 研究データ / 被引用文献 / 自動評価 / テキスト解析 |
| 研究開始時の研究の概要 |
文献の被引用回数は、学術における影響力を示す代表的な指標である。しかし、その影響を適切に評価するには、ある論文で引用された文献が、その論文の産出にどの程度貢献したのかを考慮する必要がある。本研究では、文献の新たな評価法を提起するという動機のもと、論文内の引用文脈の解析可能性と被引用文献の貢献度測定の実現可能性を示すことを目的とする。論文の本体及びメタデータから判定可能な客観的な評価法を開発する。
|
| 研究実績の概要 |
論文や研究データなどの研究成果が他の研究に与えた影響度を評価するには、ある論文においてその成果が引用されたか否かだけでなく、その論文の産出にどの程度その文献が寄与したのかに基づく必要がある。本研究では、論文内の引用箇所の周辺テキストの解析可能性と引用された研究成果の評価可能性を検証することを目的とする。そのために2年目は、論文テキストにおける引用要否判定タスクを設定し、(1)論文における引用の要否を判定する技術の検証、及び、(2)学習データの品質とドメインが与える影響の分析を以下の通り実施した。 (1)引用は学術論文において重要であり、先行研究を認識し、関連する著作へのアクセス性を高めるのに有用である。本研究では、研究成果の引用に値する箇所の検出という新しいタスクを設定した。実験では、固有表現認識を用いた学習法と単純なトークン分類法を比較した。固有表現認識に基づく手法は、学習セットとテストセットの間の分布ギャップにもかかわらず、より優れた学習能力を示しており、固有表現認識により科学的ドメイン知識を活用することが、正確なURL引用検出のための有望なアプローチであることが示された。 (2)データセットの品質とドメインの違いがURL引用の要否判定の性能に与える影響を分析した。自然言語処理,天体物理学,電気工学・システム科学の3分野からなるURL引用要否判定向けのデータセットを作成した.先行研究のデータセットと比較した結果,作成したデータセットの品質がより高いことを確認した.次に,データセットの品質が性能に与える影響を調べるために,先行研究と本研究のデータをそれぞれ学習データとした際の判定性能を比較した.その結果,本研究で作成した質の高いデータセットで学習したモデルの方が高い性能を有していることを確認した。
|
| 現在までの達成度 |
現在までの達成度
2: おおむね順調に進展している
理由
プロジェクトの2年目は、論文テキストにおける引用要否判定タスクを新たに設定し、本研究で整備してきた学術資源を活用し研究に取り組んだ。その結果、論文における引用の価値を判定する技術の検証、及び、そのための学習データの品質とドメインが与える影響の考察でいくつかの成果を得ることができた。得られた知見を査読付き論文として著名な国際会議で公表するに至っており、本課題はおおむね順調に進展しているといえる。
|
| 今後の研究の推進方策 |
次年度は、本研究で整備してきた学術論文資源の量的かつ質的拡充をさらに進める。大規模言語モデルを用いた研究成果の自動評価に取り組むことにより、前年度と今年度に試みた影響度のスコアリング性能の向上を目指す。研究推進上の致命的な問題は生じておらず、当初の研究計画に準じて取り組みを進める計画である。
|