研究課題/領域番号 |
23K20410
|
補助金の研究課題番号 |
20H04484 (2020-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2020-2023) |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 同志社大学 |
研究代表者 |
桂井 麻里衣 同志社大学, 理工学部, 准教授 (70744952)
|
研究分担者 |
大向 一輝 東京大学, 大学院人文社会系研究科(文学部), 准教授 (30413925)
梶原 智之 愛媛大学, 理工学研究科(工学系), 講師 (70824960)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
18,070千円 (直接経費: 13,900千円、間接経費: 4,170千円)
2024年度: 2,275千円 (直接経費: 1,750千円、間接経費: 525千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2021年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2020年度: 10,920千円 (直接経費: 8,400千円、間接経費: 2,520千円)
|
キーワード | 学術データ分析 / サイエンスマッピング / 研究者 / 学術ビッグデータ / 学術情報検索 / BERT / 自然言語処理 / 学術論文データベース |
研究開始時の研究の概要 |
本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、研究活動情報を入力とし、固定次元ベクトルを出力するモデルを確立する。得られたベクトルをもとに、研究者に対する論文推薦や専門分野の自動分類、共同研究者の推薦などへ応用する。これら複数のタスクにおいて従来研究との性能を比較する。
|
研究実績の概要 |
本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、大規模論文集合に高度な意味解析を導入し、研究者の多様な活動情報を埋め込める深層潜在空間を構築する。これにより、研究活動情報に対し固定次元ベクトルを出力するモデルを構築する。 2023年度のはじめには、研究者間のソーシャル・ネットワーク情報をウェブから収集し、各研究者の分野を発言内容から推定する手法を構築した。これにより、分野間のコミュニケーション状況を可視化した。得られた成果は国際会議にて2024年度に発表する。並行して研究者の活動情報をウェブから自動収集・カテゴリ分類するためのデータセット構築を継続しており、これらの成果も2024年度に発表予定である。 また、日本語や英語の事前訓練済みモデルを用いて各研究者の業績タイトルを埋め込み、それらをもとに各研究者の専門興味を表現する方法を提案するとともに、その実用可能性を検討した。具体的には,各研究者の複数の成果情報を単一の埋め込みに集約し、それを研究分野分類や類似研究者検索などのタスクへ応用した。特に、用いる言語モデルや埋め込み集約方法を複数試し、性能を比較した。実験の結果、文埋め込みモデルを用いることの有用性が確認された。得られた成果は年度末の国内研究会で公表した。今後は著者同定への応用などの実験を追加し、2024年度に国際発表する予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予定していた研究内容のうち、評価実験まで順を追って遂行できている。
|
今後の研究の推進方策 |
従来研究との比較実験を追加し、フルペーパーとして取りまとめて成果発表する。
|