2017 Fiscal Year Annual Research Report
eXtFS:Feature Selection and Exploration in extremly large multi-label classification problems
Project/Area Number |
15H02719
|
Research Institution | Hokkaido University |
Principal Investigator |
工藤 峰一 北海道大学, 情報科学研究科, 教授 (60205101)
|
Co-Investigator(Kenkyū-buntansha) |
今井 英幸 北海道大学, 情報科学研究科, 教授 (10213216)
中村 篤祥 北海道大学, 情報科学研究科, 准教授 (50344487)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | マルチラベル識別 / スケーラビリティ |
Outline of Annual Research Achievements |
最終年度である今年度は、予定した研究を着実に進めるとともに、これまでの成果を再評価しつつ残された課題の整理を行った。特に、超大規模問題に関する検討を丁寧に行った。詳細は以下の通りである。 (本年度の成果) 1. ラベルの相関利用について:各種の検討を経て、マルチラベル識別の性能向上にはラベル間の相関や確率的依存関係の利用が欠かせない一方で、ラベル数の多さから複雑な確率構造を学習することは難しいことが分かった。その結果、特徴選択とラベル相関の利用を同時に行う枠組みを提案し、その有効性を実験的に示した。2. 問題分割について:大規模問題の時間及び空間計算量を減らすには問題分割が最も直接的な解法であること、そのためには「局所性」に注目する必要性があることを論じた。そのため、サンプル空間および、特徴空間、ラベル空間での局所性を定義し、さらに、それらの局所性が識別に有効な手がかりを与えるか(「効果的局所性」であるか)を検討し、成果を公表した。3. ツールボックスの公開について:本研究成果を含む、数多くの従来手法を自由に組み合わせられるソフトウェア基盤を整備し、公開した。 (研究期間全体の評価) 1. 高性能識別への手がかり:特徴およびラベルの両方からの効果的な情報抽出の重要性を、多方面からの検討により明らかにするとともに、具体的な方式を数多く提案した。これにより、識別性能をこれまでより向上させられた一方で、これらの情報から達成できる性能限界も見え始めた。2. 大規模問題への対応:局所性に着目した問題分割法を各種検討し、対応する手法の効果も示した。一方で、分割による性能劣化は予想より大きく、今後これらのトレードオフが重要であること、さらに逐次更新のオンライン学習に向けた試みが重要となることを示した。3.残された課題:テールラベルとミッシングラベルに関する問題解決を計る必要がある。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Research Products
(2 results)