研究課題/領域番号 |
16K00419
|
研究機関 | 電気通信大学 |
研究代表者 |
川村 隆浩 電気通信大学, 大学院情報理工学研究科, 客員准教授 (10426653)
|
研究分担者 |
大須賀 昭彦 電気通信大学, 大学院情報理工学研究科, 教授 (90393842)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | リンクドデータ / 学術情報分析 |
研究実績の概要 |
初年度となる平成28年度は,学術情報(主に国内外の論文誌論文,国際会議予稿論文,全国大会発表論文,およびファンディングプロジェクトの概要文など)を収集し,Linked Data化手法の研究開発を行った. 具体的には,従来,ソーシャルメディアやコールログなど個別の事案に向けて開発してきたシステムやツールを整備し,学術情報を対象としたトリプルの抽出が可能となるよう,精度面と速度面のトレードオフを考慮しながら技術開発を行った. 技術的には,Conditional Random Fields(CRF)による確率的な推定や,ロジックに基づくルール判定,更には両者を組み合わせた統計的関係学習法Markov Logic Network(MLN)といった技術のSRL,NERへの適用を検討した.SRLとは,自然文の中から「誰が(Subject, Agent),何を(Object),誰に(Patient),どうした(Action, Predicate)」といった単語間の意味的な関係を抽出する処理である.格文法においては,文の意味構造を動詞{深層格{名詞という関係の集合として捕えており,SRLで抽出される関係は格文法における深層格に相当し,Linked Data のトリプルにおいては述語に相当する.また,時間や場所は時間格,場所格として扱われる場合もあるが,多くの場合,SRLでは対象とされないため,時間や場所はNERの一環として,person やorganizationと共に抽出対象とした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
学術情報の収集に時間がかかったが,おおむね順調に推移している.
|
今後の研究の推進方策 |
今後は,研究計画に沿って既存Linked Dataセット等とのEntity Linking(同一ノードの特定)を進める.
|
次年度使用額が生じた理由 |
研究企画の詳細化および学術情報データ収集に時間を要したため,設備等の物品購入を2年度目に先送り,また初年度出張旅費を節約し,2年度目以降の計画を増やしたため.
|
次年度使用額の使用計画 |
サーバー等の設備購入,および海外発表の推進を行う.
|