研究課題
2年目となる平成29年度は,Triplification(トリプル化)された学術情報(主に国内外の論文誌論文や国際会議予稿論文,全国大会発表論文の抄録,およびファンディングプロジェクト情報の概要文など)を対象に文書単位,単語単位で類似性を判定する技術の研究開発を行った.具体的には,日本語で書かれた学術情報と英語で書かれた学術情報をそれぞれトリプル化し,Linked Data形式のグラフ構造に変換した上で,グラフ間の類似度を計算し,同時に共通点を抽出するための技術開発を行った.技術的には,Googleらが開発したニューラルネットワークを用いた文書ベクトル化技術をベースに独自のGraph Embedding技術を開発し,日英対訳の付与された学術論文抄録1000編を対象に精度評価を実施し,高い相関性を確認した.一方で,グラフのノードとなる単語・句の間のEntity Linking技術に関しては,JST科学技術用語シソーラスおよび大規模辞書を参照し,シソーラス概念毎にShannonの情報エントロピーを算出し,エントロピーに基づいて単語ベクトルを概念ベクトルにクラスタリングすることで類似ノードを集約する技術を開発した.しかし,Springer Nature社のSciGraphやJSTのJ-Global knowledgeといった学術情報Linked Data,またはDBpediaといった一般情報に関する外部リソースへの結合は遅れており,引き続き最終年度でのサービス公開に向けて研究開発を続ける.
2: おおむね順調に進展している
外部リソースへの結合が遅れているが,おおむね順調に推移している.
最終年度に向けて学術情報のリンクトデータ化サービスに関する研究開発を進める.
年度末に購入手続きが遅れたため,次年度冒頭に購入を行う.
すべて 2018 2017 その他
すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 3件) 学会発表 (6件) (うち国際学会 6件) 図書 (1件) 備考 (1件)
International Journal of Smart Computing and Artificial Intelligence
巻: 2, 1 ページ: 79-94
IEICE Transaction on Information & Systems
巻: E101-D, 1 ページ: 116-129
https://doi.org/10.1587/transinf.2017SWP0010
巻: 1, 2 ページ: 77-93
International Journal of Semantic Computing, Special Issue on the best papers of IEEE ICSC 2017
巻: 11, 4 ページ: 433-449
https://doi.org/10.1142/S1793351X17400177
https://jipsti.jst.go.jp/foresight/