2023 Fiscal Year Annual Research Report
Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築
Project/Area Number |
20H04484
|
Allocation Type | Single-year Grants |
Research Institution | Doshisha University |
Principal Investigator |
桂井 麻里衣 同志社大学, 理工学部, 准教授 (70744952)
|
Co-Investigator(Kenkyū-buntansha) |
大向 一輝 東京大学, 大学院人文社会系研究科(文学部), 准教授 (30413925)
梶原 智之 愛媛大学, 理工学研究科(工学系), 講師 (70824960)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 学術データ分析 / 研究者 / 学術情報検索 / BERT |
Outline of Annual Research Achievements |
本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、大規模論文集合に高度な意味解析を導入し、研究者の多様な活動情報を埋め込める深層潜在空間を構築する。これにより、研究活動情報に対し固定次元ベクトルを出力するモデルを構築する。 2023年度のはじめには、研究者間のソーシャル・ネットワーク情報をウェブから収集し、各研究者の分野を発言内容から推定する手法を構築した。これにより、分野間のコミュニケーション状況を可視化した。得られた成果は国際会議にて2024年度に発表する。並行して研究者の活動情報をウェブから自動収集・カテゴリ分類するためのデータセット構築を継続しており、これらの成果も2024年度に発表予定である。 また、日本語や英語の事前訓練済みモデルを用いて各研究者の業績タイトルを埋め込み、それらをもとに各研究者の専門興味を表現する方法を提案するとともに、その実用可能性を検討した。具体的には,各研究者の複数の成果情報を単一の埋め込みに集約し、それを研究分野分類や類似研究者検索などのタスクへ応用した。特に、用いる言語モデルや埋め込み集約方法を複数試し、性能を比較した。実験の結果、文埋め込みモデルを用いることの有用性が確認された。得られた成果は年度末の国内研究会で公表した。今後は著者同定への応用などの実験を追加し、2024年度に国際発表する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予定していた研究内容のうち、評価実験まで順を追って遂行できている。
|
Strategy for Future Research Activity |
従来研究との比較実験を追加し、フルペーパーとして取りまとめて成果発表する。
|