• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築

Research Project

Project/Area Number 23K20410
Project/Area Number (Other) 20H04484 (2020-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2020-2023)
Section一般
Review Section Basic Section 90020:Library and information science, humanistic and social informatics-related
Research InstitutionDoshisha University

Principal Investigator

桂井 麻里衣  同志社大学, 理工学部, 准教授 (70744952)

Co-Investigator(Kenkyū-buntansha) 大向 一輝  東京大学, 大学院人文社会系研究科(文学部), 准教授 (30413925)
梶原 智之  愛媛大学, 理工学研究科(工学系), 講師 (70824960)
Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥18,070,000 (Direct Cost: ¥13,900,000、Indirect Cost: ¥4,170,000)
Fiscal Year 2024: ¥2,275,000 (Direct Cost: ¥1,750,000、Indirect Cost: ¥525,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2022: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2021: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2020: ¥10,920,000 (Direct Cost: ¥8,400,000、Indirect Cost: ¥2,520,000)
Keywords学術データ分析 / サイエンスマッピング / 研究者 / 学術ビッグデータ / 学術情報検索 / BERT / 自然言語処理 / 学術論文データベース
Outline of Research at the Start

本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、研究活動情報を入力とし、固定次元ベクトルを出力するモデルを確立する。得られたベクトルをもとに、研究者に対する論文推薦や専門分野の自動分類、共同研究者の推薦などへ応用する。これら複数のタスクにおいて従来研究との性能を比較する。

Outline of Annual Research Achievements

本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、大規模論文集合に高度な意味解析を導入し、研究者の多様な活動情報を埋め込める深層潜在空間を構築する。これにより、研究活動情報に対し固定次元ベクトルを出力するモデルを構築する。
2023年度のはじめには、研究者間のソーシャル・ネットワーク情報をウェブから収集し、各研究者の分野を発言内容から推定する手法を構築した。これにより、分野間のコミュニケーション状況を可視化した。得られた成果は国際会議にて2024年度に発表する。並行して研究者の活動情報をウェブから自動収集・カテゴリ分類するためのデータセット構築を継続しており、これらの成果も2024年度に発表予定である。
また、日本語や英語の事前訓練済みモデルを用いて各研究者の業績タイトルを埋め込み、それらをもとに各研究者の専門興味を表現する方法を提案するとともに、その実用可能性を検討した。具体的には,各研究者の複数の成果情報を単一の埋め込みに集約し、それを研究分野分類や類似研究者検索などのタスクへ応用した。特に、用いる言語モデルや埋め込み集約方法を複数試し、性能を比較した。実験の結果、文埋め込みモデルを用いることの有用性が確認された。得られた成果は年度末の国内研究会で公表した。今後は著者同定への応用などの実験を追加し、2024年度に国際発表する予定である。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

予定していた研究内容のうち、評価実験まで順を追って遂行できている。

Strategy for Future Research Activity

従来研究との比較実験を追加し、フルペーパーとして取りまとめて成果発表する。

Report

(4 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • 2021 Annual Research Report
  • 2020 Annual Research Report
  • Research Products

    (21 results)

All 2024 2023 2022 2021 2020 Other

All Int'l Joint Research (1 results) Journal Article (8 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 8 results,  Open Access: 4 results) Presentation (12 results) (of which Int'l Joint Research: 4 results,  Invited: 3 results)

  • [Int'l Joint Research] University of Kentucky(米国)

    • Related Report
      2021 Annual Research Report
  • [Journal Article] Illustrated character face super-deformation via unsupervised image-to-image translation2024

    • Author(s)
      Tomoya Sawada and Marie Katsurai
    • Journal Title

      Multimedia Systems

      Volume: 30 Issue: 2

    • DOI

      10.1007/s00530-023-01255-y

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Effective Language Representations for Danmaku Comment Classification in Nicovideo2023

    • Author(s)
      Hiroyoshi Nagao, Koshiro Tamura, and Marie Katsurai
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E106.D Issue: 5 Pages: 838-846

    • DOI

      10.1587/transinf.2022DAP0010

    • ISSN
      0916-8532, 1745-1361
    • Year and Date
      2023-05-01
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Analysis of Style-Shifting on Social Media: Using Neural Language Model Conditioned by Social Meanings2023

    • Author(s)
      Kawano Seiya、Kanezaki Shota、Garcia Contreras Angel Fernando、Yuguchi Akishige、Katsurai Marie、Yoshino Koichiro
    • Journal Title

      In Proceedings of The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP) findings

      Volume: 1 Pages: 7911-7921

    • DOI

      10.18653/v1/2023.findings-emnlp.531

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Data mining topics in the discipline of library and information science: analysis of influential terms and?Dirichlet multinomial regression topic model2022

    • Author(s)
      Sukjin You, Soohyung Joo, Marie Katsurai
    • Journal Title

      Aslib Journal of Information Management

      Volume: - Issue: 1 Pages: 65-85

    • DOI

      10.1108/ajim-05-2022-0260

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Exploring the digital humanities research agenda: a text mining approach2021

    • Author(s)
      Soohyung Joo, Jennifer Hootman, Marie Katsurai
    • Journal Title

      Journal of Documentation

      Volume: 78 Issue: 4 Pages: 853-870

    • DOI

      10.1108/jd-03-2021-0066

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Adoption of Data Mining Methods in the Discipline of Library and Information Science2021

    • Author(s)
      Marie Katsurai, Soohyung Joo
    • Journal Title

      Journal of Library & Information Studies

      Volume: 19

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Multilingual author matching across different academic databases: a case study on KAKEN, DBLP, and PubMed2021

    • Author(s)
      Yuto Chikazawa, Marie Katsurai, Ikki Ohmukai
    • Journal Title

      Scientometrics

      Volume: 126 Issue: 3 Pages: 2311-2327

    • DOI

      10.1007/s11192-020-03861-3

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Compact Word Embeddings Based on Global Similarity2021

    • Author(s)
      大橋 空, 五十川 真生, 梶原 智之, 荒瀬 由紀
    • Journal Title

      Journal of Natural Language Processing

      Volume: 28 Issue: 1 Pages: 235-252

    • DOI

      10.5715/jnlp.28.235

    • NAID

      130007998389

    • ISSN
      1340-7619, 2185-8314
    • Related Report
      2020 Annual Research Report
    • Peer Reviewed
  • [Presentation] 成果テキスト埋め込みの集約に基づく研究者の特徴表現の検討2024

    • Author(s)
      長尾浩良、桂井麻里衣
    • Organizer
      第259回NL研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 研究者の活動可視化に向けたウェブページの多クラス分類2024

    • Author(s)
      林容央、桂井麻里衣
    • Organizer
      2023年度 人工知能学会全国大会(第37回)
    • Related Report
      2023 Annual Research Report
  • [Presentation] 研究者アカウントからの学術的ツイートの抽出と分野分類2024

    • Author(s)
      梅澤悠河、桂井麻里衣
    • Organizer
      2023年度 人工知能学会全国大会(第37回)
    • Related Report
      2023 Annual Research Report
  • [Presentation] イラスト画像における機械学習の潮流:書誌情報の分析から2023

    • Author(s)
      桂井麻里衣
    • Organizer
      第9回コミック工学研究会
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] 学術ドメインに特化した日本語事前訓練モデルの構築2023

    • Author(s)
      山内洋輝, 梶原智之, 桂井麻里衣, 大向一輝, 二宮崇
    • Organizer
      言語処理学会第29回年次大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] SolutionTailor: Scientific Paper Recommendation Based on Fine-Grained Abstract Analysis2022

    • Author(s)
      Tetsuya Takahashi, Marie Katsurai
    • Organizer
      44th European Conference on Information Retrieval (ECIR2022)
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] A Japanese Masked Language Model for Academic Domain2022

    • Author(s)
      Hiroki Yamauchi, Tomoyuki Kajiwara, Marie Katsurai, Ikki Ohmukai, Takashi Ninomiya
    • Organizer
      Third Workshop on Scholarly Document Processing (SDP2022)
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 学術情報検索と推薦2022

    • Author(s)
      桂井麻里衣
    • Organizer
      NLP若手の会 (YANS) 第17回シンポジウム
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] 学術データの分析と可視化2021

    • Author(s)
      桂井麻里衣
    • Organizer
      電子情報通信学会信号処理研究会(SIP)
    • Related Report
      2021 Annual Research Report
    • Invited
  • [Presentation] Finding the Relevance Between Publication Venues Based on Research Trend Similarity and Citation Relationships2021

    • Author(s)
      Tomoya Nishide, Marie Katsurai
    • Organizer
      2021 ACM/IEEE Joint Conference on Digital Libraries (JCDL)
    • Related Report
      2021 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Selective Classification of Danmaku Comments Using Distributed Representations2021

    • Author(s)
      Koshiro Tamura, Marie Katsurai
    • Organizer
      The 23rd International Conference on Information Integration and Web Intelligence
    • Related Report
      2021 Annual Research Report
  • [Presentation] A Novel Researcher Search System Based on Research Content Similarity and Geographic Information2020

    • Author(s)
      Tetsuya Takahashi, Koya Tango, Yuto Chikazawa, Marie Katsurai
    • Organizer
      International Conference on Asian Digital Libraries (ICADL) 2020
    • Related Report
      2020 Annual Research Report
    • Int'l Joint Research

URL: 

Published: 2020-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi