2016 Fiscal Year Annual Research Report
Improvement of Nonnegative Matrix Factorization method using competitive learning
Project/Area Number |
26330259
|
Research Institution | Hokkaido Information University |
Principal Investigator |
内山 俊郎 北海道情報大学, 経営情報学部, 教授 (80708644)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 競合学習 / 非負値行列因子分解 / トピックモデル / PLSA |
Outline of Annual Research Achievements |
本研究では、従来研究と比較し高速・高精度な非負値行列因子分解(NMF)手法を確立することを目的とし、理論的な検討と実験による検証により、高速・高精度なNMF手法の導出と検証に至った。理論的には「情報理論的クラスタリングの目的関数がNMFと等価であり、その解がNMFの制約付きの解(ハードクラスタリング制約)であること」を示した。情報理論的クラスタリングについては、競合学習を用いたアルゴリズムが知られており、目的関数最適化の意味で優れた解に到達できることが知られている。これをNMFのための初期値設定に用いることで、従来法では達成困難な高精度なNMFの解が得られる可能性がある。実際に高精度な解が得られることを示したのが、実験による検証である。この検証を通して、従来行われていたランダムな初期値設定よりも、情報理論的クラスタリングの結果を利用した初期値設定法(提案手法。具体的な設定方法に工夫あり)が目的関数(パープレキシティ)の意味で優れた解に到達できることを、多数のデータセットにおいて示した。なお、直接的にNMFを行うアルゴリズムの検討を行い、具体的なアルゴリズムも創出し、実験により一定の有効性を確認した。上記研究は、ハードクラスタリングである情報理論的クラスタリングとソフトクラスタリングであるNMFやそれと関連の深いトピックモデルという研究分野をつなげたといえる。すなわち、情報理論的クラスタリングの有用性は、これを拡張したトピックモデルの有用性をも表していることになる。一連の研究成果は、論文1件(「情報理論的クラスタリングを用いた確率的潜在意味解析の性能向上」、信学論2017)、英文著書1件("Information-Theoretic Clustering and Algorithms",InTech,2017)、特許1件、教科書1件、紀要1件、学会発表数件、として公開した。
|
Research Products
(6 results)
-
-
-
-
-
-
[Book] Advances in Statistical Methodologies and Their Application to Real Problems2017
Author(s)
A. Spanos, H.S. Hoang, A. Hoskuldsson, G. Travaglini, T. Uchiyama, I. Ghosh, G.V. Weinberg, Y. Dominicy, A. Mihoci, S. Schmidt, R. Zaki, M. Agrawal, S. Vidyashankar, S. Balli, R. Ametila, H. Nishijo, M.J. D’Souza, E.A. Brandenburg, D. E. Wentzien, R. C. Bautista, A. P. Nwogbaga, R. G. Miller
Total Pages
324,(93-119)
Publisher
InTech