2014 Fiscal Year Research-status Report
メトリックラーニングに基づく大規模実データの分析手法と理論評価に関する研究
Project/Area Number |
26750118
|
Research Institution | Waseda University |
Principal Investigator |
三川 健太 早稲田大学, 理工学術院, 助手 (40707733)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | メトリックラーニング / ベクトル空間モデル / パターン認識 / 正則化 |
Outline of Annual Research Achievements |
2014年度の研究実績として,実データへのメトリックラーニング手法の適用可能性を検討するため,従来手法の問題点の改善を行った.具体的には,以下に示す3点について提案を行った. 1点目は,l1正則化を用いたメトリックラーニング手法の提案であり,これは高次元なデータを対象とした場合メトリックラーニング手法で学習すべきパラメータ数が過多となり,正確なパラメータ推定が難しいという点を改善するための手法である.当該手法について,その詳細な定式化,ならびに複数のベンチマークデータを用いた性能解析を行うことでその有効性を示した. 2点目は複数の計量行列を用いた距離計量の学習方法の提案と,それを用いた新規入力データの分類手法の提案であり,複数のカテゴリからなる学習データの統計的特徴を詳細に把握することが可能な手法であるといえる.この手法を用いることで従来のメトリックラーニング手法と比較し,その分類精度が向上することをシミュレーション実験により確認することができた. 3点目は最適な計量行列を導出するための最適化問題の検討であり,従来行われている手法で用いられていなかった複数カテゴリの情報を考慮した最適な計量行列導出の手法について提案を行った.加えて,正則化パラメータを変更することにより,その役割が変化することを示した.当手法を用いることで新規入力データの分類精度が向上することを確認するとともに,正則化パラメータの変化による分類精度の差異についても検討を行った. 上記の研究のうち,1点目,2点目共に論文投稿を行い,条件付き採録となっている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は「実データへの適用のためのメトリックラーニング手法の構築」,ならびに「分類誤差の理論評価法の提案」の二つの目的により構成されている. 前者の「実データへの適用のためのメトリックラーニング手法の構築」に関しては新たな手法の提案ならびにその有効性の検証を実施することができた.これらの結果を査読付き国際会議で発表,ならびに論文投稿を行っており,当初の予定以上の進捗状況であるといえる. 一方で後者の「分類誤差の理論評価法の提案」に関しては,従来行われている理論解析を直接適用することが難しいということが判明したため,当該内容に関する研究進捗としてはやや遅れてしまっている. 両者を総合的に鑑みると,進捗状況に一長一短はあるものの,おおむね順調に進展していると考えられる.
|
Strategy for Future Research Activity |
平成26年度の計画として提示したメトリックラーニング手法の理論評価については,既存手法の援用では望ましい答えを得ることができないことが判明したため,さらなる文献調査,解析手法の検討が必要であると言える.これに関しては,昨年度より継続して調査を続けている.多くのメトリックラーニング手法ではその理論評価は行われておらず,その枠組みを検討していくことには意義があると考えられる.このため,継続してその方法について検討を行っていく予定である. また,申請者により提案されている複数の手法は組み合わせて用いることが可能であり,それにより効果的,かつ効率的に距離計量の学習が可能となる方法について検討を行う予定である.合わせて,統合的なメトリックラーニングにおけるフレームワークの構築を目指す. 加えて,本年度は提案手法の実データへ適用するために必要な手法について検討を行う予定である.これは,通常のメトリックラーニング手法は計算コストが非常に多く,単純に大規模な実データへ適用した場合,現実的な時間で解を得ることが難しいと想定されるためである.したがって,これらの問題点の改善のために,本年度は特にその計算量の低減手法についてアルゴリズムの面,計算機資源の面の両者から検討を行う予定である.
|
Research Products
(10 results)