2013 Fiscal Year Research-status Report
構造的関連性学習を用いた大規模学術情報のリンケージに関する研究
Project/Area Number |
24700137
|
Research Institution | The University of Tokyo |
Principal Investigator |
森 純一郎 東京大学, 工学(系)研究科(研究院), 講師 (30508924)
|
Keywords | 計量書誌分析 / 構造的関連性学習 / 機械学習 / 情報検索 |
Research Abstract |
本研究では、論文、特許、ウェブといった膨大な学術情報を横断的に関連づけることより近年爆発的に増加している大規模学術情報の検索基盤を確立することを目的とする。そのために、構造的関連性学習を用いて、論文と特許、論文と企業、論文とウェブ情報といった大規模学術情報の関連づけ(リンケージ)について研究を行う。 平成25年度は、研究項目「論文・特許・企業・ウェブの学術情報を対象とした検索システムの設計と実装」として、平成24年に設計・実装を行った異種の学術情報の文書間の関連性を計算する技術を元に、学術情報検索システムの設計と実装を行った。同システムの入力となるのは、任意の学術情報の文書であり、例えば、ある論文をシステムを入力するとその論文に関連する特許情報、企業情報およびウェブ情報を出力として提示するものである。 研究項目「異種学術情報検索結果のランキングと提示手法の設計と実装」について、検索システムにおいて、入力文書に関連する異なる学術情報の文書の一覧を提示際、その検索結果において複数の学術情報を適切に混在させランキングするための手法の設計と実装を行った。 最後に、研究項目「実証実験による手法およびシステムの評価および改善ならびに成果公開」について、上記により設計・実装を行った異種学術情報検索システムについて、「学術俯瞰システム」を構築し実証実験を行った。実証実験においては、抽出した概念語の妥当性、線形識別器の精度、文書間の関連度計算の精度、検索結果提示の妥当性について特に評価を行い、その結果をもとに再度手法およびシステムの改善を行った。本研究の成果となる異種学術情報検索システムは実証実験後も広く一般に利用可能な形でウェブシステムとして公開する。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本研究では、論文、特許、ウェブといった膨大な学術情報を横断的に関連づけることより近年爆発的に増加している大規模学術情報の検索基盤を確立することを目的とする。そのために、構造的関連性学習を用いて、論文と特許、論文と企業、論文とウェブ情報といった大規模学術情報の関連づけ(リンケージ)について研究を行う。これにより、異なる学術情報のテキストを関連づける教師なしの機械学習手法について明らかにする。さらに、異なる学術情報の関連する文書を検索して提示するシステムを構築し、従来の学術情報検索サービスと連携した実証実験を通じて、異種学術情報を横断した文書検索手法について明らかにする。 本研究では、そのため構造的関連性学習を用いた大規模学術情報のリンケージ手法について具体的に以下の項目について研究を行った。1. 構造的関連性学習を用いて異種の学術情報間の関連性を計算する技術、2. 任意の入力文書に対して異種の学術情報を横断して文書検索を行う技術。 まず1.については、平成24年度に行った「大規模な異種学術情報の収集と特徴抽出手法の設計と実装」、「構造的関連性学習により学術情報の文書を高次概念空間へ写像する手法の設計と実装」、「高次概念空間において文書間の関連性を計算する手法の設計と実装」の各研究項目により、その目標を達成している。次に2.については、平成25年度に学術情報検索システムの設計と実装を行った。同システムは、任意の入力文書(例えば論文)に対して、異なる学術情報(特許、企業、ウェブ)の関連する文書を検索して提示するシステムであり、実証実験を通じて、異種学術情報を横断した文書検索手法について明らかにした。その成果を「学術俯瞰システム」として公開した。
|
Strategy for Future Research Activity |
構造性関連性学習を用いた大規模学術情報のリンケージ手法について、ニューラルネットワーク言語モデルと組み合わせる事により、精度向上が図れるという知見を得たため、引き続き手法の改善の評価を進める。システムの通した実証実験を元に評価を行い、成果を発表する。本研究の成果の一つである「学術俯瞰システム」については、実証実験後も広く一般に利用可能な形で公開する。
|
Expenditure Plans for the Next FY Research Funding |
構造性関連性学習を用いた大規模学術情報のリンケージ手法について、ニューラルネットワーク言語モデルと組み合わせる事により、精度向上が図れるという知見を得たため、引き続き手法の改善の評価を進める。システムの通した実証実験を元に評価を行い、成果を発表する。本研究の成果の一つである「学術俯瞰システム」については、実証実験後も広く一般に利用可能な形で公開する。 旅費として成果発表の国外出張旅費が必要。システムの評価実験に謝金が必要。
|