2011 Fiscal Year Annual Research Report
互いに関連を持つ複数の大規模リレーショナルデータの統合モデリング法
Project/Area Number |
11J07843
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
林 浩平 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
|
Keywords | 機械学習 / データマイニング / 確率モデリング / テンソル / 学習アルゴリズム |
Research Abstract |
今年度はまず単一のデータテンソルのモデリングに注力し,自己計測類似度を用いたテンソル補完の枠組みを提案した.この枠組みでは類似度を測る際の指標として観測したテンソルそのものを用いる.既存手法であるテンソル分解法のように類似度を表すパラメータを陽に推定する必要がないため,より自由な表現が可能となる.また計算量の爆発を抑えるため,データが持つテンソルの構造を利用した,共役勾配法に基づく効率的な学習アルゴリズムを同時に開発した.複数の実データを用いて計算機実験を行った結果,複雑な構造を持つデータほど提案手法の予測精度が相対的に向上することを確認した.これらの成果は国内論文誌[人工知能学会論文誌,採用決定],国際ワークショップ[ICML Unsupervised and Transfer Learning Workshop, 2011],国内研究会[第14回情報論的学習理論ワークショップ,2011]にてそれぞれ発表をおこなった. また2012年1月から3月の間日本電気株式会社(NEC)にてインターンシップを行い,より大規模なデータを処理するアルゴリズムの開発のため,疎線形モデルを高速に解くアルゴリズムの一種であるFOBOSの調査とその実装を行った.与えられたデータが疎,すなわち多くの要素がゼロである場合,FOBOSはその疎性をなるべく保持したまま学習を行い,非ゼロ要素数のみに比例した計算コストでの学習を可能とする.またテンソルモデルへの応用も考案中である.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度は従来のテンソル分解法の限界を超えるデータモデリング手法を開発する予定であった.特別研究員は自己計測類似度を用いたテンソルモデリング手法を提案し,これが欠損データの推定に有用であることを示した.さらに計算量を削減するため,共役勾配法に基づく効率的な計算法を考案した.これにより提案手法が実データに対して応用可能となり,従来法よりも高い精度で予測が可能となった.
|
Strategy for Future Research Activity |
今年度行った単一データテンソルのモデリングを拡張し,複数テンソルのモデリングを行う.また,FOBOSの調査で得た技術を用いて高速なテンソル補完のためのアルゴリズムの開発を行う予定である.
|
Research Products
(4 results)