2018 Fiscal Year Annual Research Report
New development in hubness-aware metric learning in high dimensional data
Project/Area Number |
15H02749
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
新保 仁 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (90311589)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 近傍検索 / ベクトル表現モデル / 知識獲得 / 知識表現 |
Outline of Annual Research Achievements |
2018 年度は以下の成果を得た. (i) 近年科学論文の数は爆発的に増加し, 研究者の関連研究検索を困難にしている. これを緩和する手助けとして, 個々の論文をベクトル化し, これに基づいて検索する手法について研究を行った. 我々の手法は, 個々の論文を単一ベクトルとして表現するのではなく, 背景・目的・といった, 多くの論文が共通に持ついくつかの側面ごとに個々の論文をベクトル化を行う. 共通の文脈で引用されている文献は同様の側面に注目して引用されているはずだ, という仮定に基づき, 一方の論文が与えられた際にそれと共通に引用されている文献を予測するタスクを用いた性能の検証を行い, 単一ベクトル表現に比較して, 提案法が良い精度を得ることを示した. (ii)ブートストラッピングと呼ばれる, 文書からの知識獲得法において, 獲得プロセスの初期に用いる「シード (種)」と呼ばれるインスタンスとして何を選ぶかは, 性能を作用する重要な要件である. これについて, ハブ度に基づく分析を行い, シード選択法を提案した. 同様に, ノイズの混在したサンプルを用いる distant supervision と呼ばれる設定において, ノイズを低減する手法を開発した. (iii) 代表的な知識グラフのベクトル空間埋め込みモデルの多くが, 複数の関係が関わる問い合わせ ( 例: チャールズの妻の父親は誰?) のモデル化に本質的に不適切であることを指摘した. さらに, この問題を解決するために, 既存 ComplEx モデルを拡張した手法を提案した.
|
Research Progress Status |
平成30年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成30年度が最終年度であるため、記入しない。
|