2017 Fiscal Year Research-status Report
学術情報の意味的・計量的分析に向けた論文抄録のリンクトデータ化手法に関する研究
Project/Area Number |
16K00419
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
川村 隆浩 電気通信大学, 大学院情報理工学研究科, 客員准教授 (10426653)
|
Co-Investigator(Kenkyū-buntansha) |
大須賀 昭彦 電気通信大学, 大学院情報理工学研究科, 教授 (90393842)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | リンクドデータ / 学術情報分析 |
Outline of Annual Research Achievements |
2年目となる平成29年度は,Triplification(トリプル化)された学術情報(主に国内外の論文誌論文や国際会議予稿論文,全国大会発表論文の抄録,およびファンディングプロジェクト情報の概要文など)を対象に文書単位,単語単位で類似性を判定する技術の研究開発を行った. 具体的には,日本語で書かれた学術情報と英語で書かれた学術情報をそれぞれトリプル化し,Linked Data形式のグラフ構造に変換した上で,グラフ間の類似度を計算し,同時に共通点を抽出するための技術開発を行った. 技術的には,Googleらが開発したニューラルネットワークを用いた文書ベクトル化技術をベースに独自のGraph Embedding技術を開発し,日英対訳の付与された学術論文抄録1000編を対象に精度評価を実施し,高い相関性を確認した. 一方で,グラフのノードとなる単語・句の間のEntity Linking技術に関しては,JST科学技術用語シソーラスおよび大規模辞書を参照し,シソーラス概念毎にShannonの情報エントロピーを算出し,エントロピーに基づいて単語ベクトルを概念ベクトルにクラスタリングすることで類似ノードを集約する技術を開発した. しかし,Springer Nature社のSciGraphやJSTのJ-Global knowledgeといった学術情報Linked Data,またはDBpediaといった一般情報に関する外部リソースへの結合は遅れており,引き続き最終年度でのサービス公開に向けて研究開発を続ける.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
外部リソースへの結合が遅れているが,おおむね順調に推移している.
|
Strategy for Future Research Activity |
最終年度に向けて学術情報のリンクトデータ化サービスに関する研究開発を進める.
|
Causes of Carryover |
年度末に購入手続きが遅れたため,次年度冒頭に購入を行う.
|
-
-
-
-
-
-
-
-
-
-
-
[Book] Scientometrics2018
Author(s)
T. Kawamura, K. Watanabe, N. Matsumoto, S. Egami, M. Jibu
Total Pages
未定
Publisher
InTechOpen
ISBN
978-953-51-6239-1
-