2023 Fiscal Year Annual Research Report

Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築

Research Project

Project/Area Number	20H04484
Allocation Type	Single-year Grants
Research Institution	Doshisha University
Principal Investigator	桂井麻里衣同志社大学, 理工学部, 准教授 (70744952)
Co-Investigator(Kenkyū-buntansha)	大向一輝東京大学, 大学院人文社会系研究科(文学部), 准教授 (30413925) 梶原智之愛媛大学, 理工学研究科(工学系), 講師 (70824960)
Project Period (FY)	2020-04-01 – 2025-03-31
Keywords	学術データ分析 / 研究者 / 学術情報検索 / BERT
Outline of Annual Research Achievements	本研究の目的は、ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し、個々の研究者の専門興味を多元的に表現する技術を構築することである。具体的には、大規模論文集合に高度な意味解析を導入し、研究者の多様な活動情報を埋め込める深層潜在空間を構築する。これにより、研究活動情報に対し固定次元ベクトルを出力するモデルを構築する。 2023年度のはじめには、研究者間のソーシャル・ネットワーク情報をウェブから収集し、各研究者の分野を発言内容から推定する手法を構築した。これにより、分野間のコミュニケーション状況を可視化した。得られた成果は国際会議にて2024年度に発表する。並行して研究者の活動情報をウェブから自動収集・カテゴリ分類するためのデータセット構築を継続しており、これらの成果も2024年度に発表予定である。また、日本語や英語の事前訓練済みモデルを用いて各研究者の業績タイトルを埋め込み、それらをもとに各研究者の専門興味を表現する方法を提案するとともに、その実用可能性を検討した。具体的には，各研究者の複数の成果情報を単一の埋め込みに集約し、それを研究分野分類や類似研究者検索などのタスクへ応用した。特に、用いる言語モデルや埋め込み集約方法を複数試し、性能を比較した。実験の結果、文埋め込みモデルを用いることの有用性が確認された。得られた成果は年度末の国内研究会で公表した。今後は著者同定への応用などの実験を追加し、2024年度に国際発表する予定である。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 予定していた研究内容のうち、評価実験まで順を追って遂行できている。
Strategy for Future Research Activity	従来研究との比較実験を追加し、フルペーパーとして取りまとめて成果発表する。

Research Products
(6 results)

All 2024 2023

All Journal Article (3 results) (of which Peer Reviewed: 3 results, Open Access: 2 results) Presentation (3 results)

[Journal Article] Illustrated character face super-deformation via unsupervised image-to-image translation2024
- Author(s)
  Tomoya Sawada and Marie Katsurai
- Journal Title
  
  Multimedia Systems
  
  Volume: 30 Pages: -
- DOI
  10.1007/s00530-023-01255-y
- Peer Reviewed
[Journal Article] Analysis of Style-Shifting on Social Media: Using Neural Language Model Conditioned by Social Meanings2023
- Author(s)
  Seiya Kawano, Shota Kanezaki, Angel Fernando Garcia Contreras, Akishige Yuguchi, Marie Katsurai, and Koichiro Yoshino
- Journal Title
  
  Findings of the Association for Computational Linguistics: EMNLP 2023
  
  Volume: - Pages: 7911--7921
- DOI
  10.18653/v1/2023.findings-emnlp.531
- Peer Reviewed / Open Access
[Journal Article] Effective Language Representations for Danmaku Comment Classification in Nicovideo2023
- Author(s)
  Hiroyoshi Nagao, Koshiro Tamura, and Marie Katsurai
- Journal Title
  
  IEICE Transactions on Information and Systems
  
  Volume: E106-D Pages: 838--846
- DOI
  10.1587/transinf.2022DAP0010
- Peer Reviewed / Open Access
[Presentation] 成果テキスト埋め込みの集約に基づく研究者の特徴表現の検討2024
- Author(s)
  長尾浩良、桂井麻里衣
- Organizer
  第259回NL研究発表会
[Presentation] 研究者の活動可視化に向けたウェブページの多クラス分類2024
- Author(s)
  林容央、桂井麻里衣
- Organizer
  2023年度人工知能学会全国大会（第37回）
[Presentation] 研究者アカウントからの学術的ツイートの抽出と分野分類2024
- Author(s)
  梅澤悠河、桂井麻里衣
- Organizer
  2023年度人工知能学会全国大会（第37回）

2023 Fiscal Year Annual Research Report

Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築

Principal Investigator

桂井 麻里衣 同志社大学, 理工学部, 准教授 (70744952)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Illustrated character face super-deformation via unsupervised image-to-image translation2024

Author(s)

Journal Title

DOI

[Journal Article] Analysis of Style-Shifting on Social Media: Using Neural Language Model Conditioned by Social Meanings2023

Author(s)

Journal Title

DOI

[Journal Article] Effective Language Representations for Danmaku Comment Classification in Nicovideo2023

Author(s)

Journal Title

DOI

[Presentation] 成果テキスト埋め込みの集約に基づく研究者の特徴表現の検討2024

Author(s)

Organizer

[Presentation] 研究者の活動可視化に向けたウェブページの多クラス分類2024

Author(s)

Organizer

[Presentation] 研究者アカウントからの学術的ツイートの抽出と分野分類2024

Author(s)

Organizer

桂井麻里衣同志社大学, 理工学部, 准教授 (70744952)