2016 Fiscal Year Annual Research Report
eXtFS:Feature Selection and Exploration in extremly large multi-label classification problems
Project/Area Number |
15H02719
|
Research Institution | Hokkaido University |
Principal Investigator |
工藤 峰一 北海道大学, 情報科学研究科, 教授 (60205101)
|
Co-Investigator(Kenkyū-buntansha) |
今井 英幸 北海道大学, 情報科学研究科, 教授 (10213216)
中村 篤祥 北海道大学, 情報科学研究科, 准教授 (50344487)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | マルチラベル識別問題 / 相関 / スケーラビリティ |
Outline of Annual Research Achievements |
本年度は主に、ラベル間の相関に関する解析とその利用を検討した。また、特徴選択の必要性と効果についても検討した。結果として、それぞれ以下の成果を得て論文を公表した。 1. ラベル間の相関については、併せて、特徴ー特徴間、特徴ーラベル間、ラベルーラベル間の相関について同時に検討することとして、3種類の可視化方式を提案した。その結果、a)ラベルセットはその各々のラベルの中間的性質を持つものではないこと、よって、シングルラベル識別で絞り込むことが難しいこと、b)ラベルは特徴とは強い相関は持たないこと、などを明らかにした。また、それほど大きくない問題においては、特徴とラベルを同一低次元空間に埋め込むことで識別率を上げられることを示した。2.特徴選択に関しては、これまであった(シングル)ラベル依存型の特徴選択を一般化し、ラベルセット依存型の特徴選択の必要性を論じ、対応する手法を提案してその効果を確認した。さらに、3.特に、大規模マルチラベル識別問題に対するスケーラビリティ確保手法として。1) 特徴空間でのクラスタリングにより訓練サンプルを分割する方法を提案し、その有効性を確認した。2) ラベル空間でのクラスタリングにより訓練サンプルを分割する方法を提案し、やはりその有効性を確認した。一方で、大規模マルチラベル識別に固有な問題、テイルラベルといった滅多に出現しないラベルやミッシングラベルといった付け忘れられたラベルの存在が識別性能に大きく影響することがわかったため、予算の一部を翌年度に繰り越してじっくり検討することとした。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
博士学生2名、修士学生1名の助力が大きく、多方面からの検討が素早く精密に行えたことが大きい。
|
Strategy for Future Research Activity |
計画通り、問題の理解を含め、各種の識別方式を提案しつつ、最終的には超大規模問題に向けての解決策を探る。
|
Research Products
(9 results)