• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築

研究課題

研究課題/領域番号 23K20410
補助金の研究課題番号 20H04484 (2020-2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2020-2023)
応募区分一般
審査区分 小区分90020:図書館情報学および人文社会情報学関連
研究機関同志社大学

研究代表者

桂井 麻里衣  同志社大学, 理工学部, 准教授 (70744952)

研究分担者 大向 一輝  東京大学, 大学院人文社会系研究科(文学部), 准教授 (30413925)
梶原 智之  愛媛大学, 理工学研究科(工学系), 講師 (70824960)
研究期間 (年度) 2020-04-01 – 2025-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
18,070千円 (直接経費: 13,900千円、間接経費: 4,170千円)
2024年度: 2,275千円 (直接経費: 1,750千円、間接経費: 525千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2021年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2020年度: 10,920千円 (直接経費: 8,400千円、間接経費: 2,520千円)
キーワード学術データ分析 / サイエンスマッピング / 研究者 / 学術ビッグデータ / 学術情報検索 / BERT / 自然言語処理 / 学術論文データベース
研究開始時の研究の概要

本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、研究活動情報を入力とし、固定次元ベクトルを出力するモデルを確立する。得られたベクトルをもとに、研究者に対する論文推薦や専門分野の自動分類、共同研究者の推薦などへ応用する。これら複数のタスクにおいて従来研究との性能を比較する。

研究実績の概要

本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、大規模論文集合に高度な意味解析を導入し、研究者の多様な活動情報を埋め込める深層潜在空間を構築する。これにより、研究活動情報に対し固定次元ベクトルを出力するモデルを構築する。
2023年度のはじめには、研究者間のソーシャル・ネットワーク情報をウェブから収集し、各研究者の分野を発言内容から推定する手法を構築した。これにより、分野間のコミュニケーション状況を可視化した。得られた成果は国際会議にて2024年度に発表する。並行して研究者の活動情報をウェブから自動収集・カテゴリ分類するためのデータセット構築を継続しており、これらの成果も2024年度に発表予定である。
また、日本語や英語の事前訓練済みモデルを用いて各研究者の業績タイトルを埋め込み、それらをもとに各研究者の専門興味を表現する方法を提案するとともに、その実用可能性を検討した。具体的には,各研究者の複数の成果情報を単一の埋め込みに集約し、それを研究分野分類や類似研究者検索などのタスクへ応用した。特に、用いる言語モデルや埋め込み集約方法を複数試し、性能を比較した。実験の結果、文埋め込みモデルを用いることの有用性が確認された。得られた成果は年度末の国内研究会で公表した。今後は著者同定への応用などの実験を追加し、2024年度に国際発表する予定である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

予定していた研究内容のうち、評価実験まで順を追って遂行できている。

今後の研究の推進方策

従来研究との比較実験を追加し、フルペーパーとして取りまとめて成果発表する。

報告書

(4件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 2021 実績報告書
  • 2020 実績報告書
  • 研究成果

    (21件)

すべて 2024 2023 2022 2021 2020 その他

すべて 国際共同研究 (1件) 雑誌論文 (8件) (うち国際共著 3件、 査読あり 8件、 オープンアクセス 4件) 学会発表 (12件) (うち国際学会 4件、 招待講演 3件)

  • [国際共同研究] University of Kentucky(米国)

    • 関連する報告書
      2021 実績報告書
  • [雑誌論文] Illustrated character face super-deformation via unsupervised image-to-image translation2024

    • 著者名/発表者名
      Tomoya Sawada and Marie Katsurai
    • 雑誌名

      Multimedia Systems

      巻: 30 号: 2

    • DOI

      10.1007/s00530-023-01255-y

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Effective Language Representations for Danmaku Comment Classification in Nicovideo2023

    • 著者名/発表者名
      Hiroyoshi Nagao, Koshiro Tamura, and Marie Katsurai
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E106.D 号: 5 ページ: 838-846

    • DOI

      10.1587/transinf.2022DAP0010

    • ISSN
      0916-8532, 1745-1361
    • 年月日
      2023-05-01
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Analysis of Style-Shifting on Social Media: Using Neural Language Model Conditioned by Social Meanings2023

    • 著者名/発表者名
      Kawano Seiya、Kanezaki Shota、Garcia Contreras Angel Fernando、Yuguchi Akishige、Katsurai Marie、Yoshino Koichiro
    • 雑誌名

      In Proceedings of The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP) findings

      巻: 1 ページ: 7911-7921

    • DOI

      10.18653/v1/2023.findings-emnlp.531

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Data mining topics in the discipline of library and information science: analysis of influential terms and?Dirichlet multinomial regression topic model2022

    • 著者名/発表者名
      Sukjin You, Soohyung Joo, Marie Katsurai
    • 雑誌名

      Aslib Journal of Information Management

      巻: - 号: 1 ページ: 65-85

    • DOI

      10.1108/ajim-05-2022-0260

    • 関連する報告書
      2022 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Exploring the digital humanities research agenda: a text mining approach2021

    • 著者名/発表者名
      Soohyung Joo, Jennifer Hootman, Marie Katsurai
    • 雑誌名

      Journal of Documentation

      巻: 78 号: 4 ページ: 853-870

    • DOI

      10.1108/jd-03-2021-0066

    • 関連する報告書
      2021 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Adoption of Data Mining Methods in the Discipline of Library and Information Science2021

    • 著者名/発表者名
      Marie Katsurai, Soohyung Joo
    • 雑誌名

      Journal of Library & Information Studies

      巻: 19

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Multilingual author matching across different academic databases: a case study on KAKEN, DBLP, and PubMed2021

    • 著者名/発表者名
      Yuto Chikazawa, Marie Katsurai, Ikki Ohmukai
    • 雑誌名

      Scientometrics

      巻: 126 号: 3 ページ: 2311-2327

    • DOI

      10.1007/s11192-020-03861-3

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 大域的な類似度に基づく単語分散表現の圧縮2021

    • 著者名/発表者名
      大橋 空, 五十川 真生, 梶原 智之, 荒瀬 由紀
    • 雑誌名

      自然言語処理

      巻: 28 号: 1 ページ: 235-252

    • DOI

      10.5715/jnlp.28.235

    • NAID

      130007998389

    • ISSN
      1340-7619, 2185-8314
    • 関連する報告書
      2020 実績報告書
    • 査読あり
  • [学会発表] 成果テキスト埋め込みの集約に基づく研究者の特徴表現の検討2024

    • 著者名/発表者名
      長尾浩良、桂井麻里衣
    • 学会等名
      第259回NL研究発表会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 研究者の活動可視化に向けたウェブページの多クラス分類2024

    • 著者名/発表者名
      林容央、桂井麻里衣
    • 学会等名
      2023年度 人工知能学会全国大会(第37回)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 研究者アカウントからの学術的ツイートの抽出と分野分類2024

    • 著者名/発表者名
      梅澤悠河、桂井麻里衣
    • 学会等名
      2023年度 人工知能学会全国大会(第37回)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] イラスト画像における機械学習の潮流:書誌情報の分析から2023

    • 著者名/発表者名
      桂井麻里衣
    • 学会等名
      第9回コミック工学研究会
    • 関連する報告書
      2022 実績報告書
    • 招待講演
  • [学会発表] 学術ドメインに特化した日本語事前訓練モデルの構築2023

    • 著者名/発表者名
      山内洋輝, 梶原智之, 桂井麻里衣, 大向一輝, 二宮崇
    • 学会等名
      言語処理学会第29回年次大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] SolutionTailor: Scientific Paper Recommendation Based on Fine-Grained Abstract Analysis2022

    • 著者名/発表者名
      Tetsuya Takahashi, Marie Katsurai
    • 学会等名
      44th European Conference on Information Retrieval (ECIR2022)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] A Japanese Masked Language Model for Academic Domain2022

    • 著者名/発表者名
      Hiroki Yamauchi, Tomoyuki Kajiwara, Marie Katsurai, Ikki Ohmukai, Takashi Ninomiya
    • 学会等名
      Third Workshop on Scholarly Document Processing (SDP2022)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 学術情報検索と推薦2022

    • 著者名/発表者名
      桂井麻里衣
    • 学会等名
      NLP若手の会 (YANS) 第17回シンポジウム
    • 関連する報告書
      2022 実績報告書
    • 招待講演
  • [学会発表] 学術データの分析と可視化2021

    • 著者名/発表者名
      桂井麻里衣
    • 学会等名
      電子情報通信学会信号処理研究会(SIP)
    • 関連する報告書
      2021 実績報告書
    • 招待講演
  • [学会発表] Finding the Relevance Between Publication Venues Based on Research Trend Similarity and Citation Relationships2021

    • 著者名/発表者名
      Tomoya Nishide, Marie Katsurai
    • 学会等名
      2021 ACM/IEEE Joint Conference on Digital Libraries (JCDL)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Selective Classification of Danmaku Comments Using Distributed Representations2021

    • 著者名/発表者名
      Koshiro Tamura, Marie Katsurai
    • 学会等名
      The 23rd International Conference on Information Integration and Web Intelligence
    • 関連する報告書
      2021 実績報告書
  • [学会発表] A Novel Researcher Search System Based on Research Content Similarity and Geographic Information2020

    • 著者名/発表者名
      Tetsuya Takahashi, Koya Tango, Yuto Chikazawa, Marie Katsurai
    • 学会等名
      International Conference on Asian Digital Libraries (ICADL) 2020
    • 関連する報告書
      2020 実績報告書
    • 国際学会

URL: 

公開日: 2020-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi