研究課題/領域番号 |
26330259
|
研究機関 | 北海道情報大学 |
研究代表者 |
内山 俊郎 北海道情報大学, 経営情報学部, 教授 (80708644)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 競合学習 / 非負値行列因子分解 / 最適化 |
研究実績の概要 |
本研究の目的は、競合学習という確率的探索手法を用い、従来研究と比較し高速・高精度な分解手法を確立することである。研究実施計画に記載したように、文書クラスタリングで有効性が確認された「情報理論的クラスタリング」の拡張でもある「一般化KLダイバージェンス」を目的関数とする場合の、新しいアルゴリズム開発に取り組み、実際にアルゴリズムを考案した。第1の成果は、このアルゴリズムに関する特許を申請したことである。(特願2014-160752、「計算処理装置、計算処理方法、計算処理システム、及びプログラム」)第2の成果は、文書データを対象とした比較実験を行い、電子情報通信学会の研究会(3研究会共催、PRMU2014-37「競合学習を用いた非負値行列因子分解」)で成果を発表(報告)したことである。この報告では、競合学習によって得られた解を初期値として解を探索することが、従来のランダムな値を初期値とするよりも、統計的に有意な差をもって、優れた解へ到達することを示した。従来法よりも優れる分解手法を示せたことは、大きな成果であると考える。また、「情報理論的クラスタリングの解」が「一般化KLダイバージェンスを目的関数とする非負値行列因子分解の特殊解」であることを数式として示したことも、今後の関連研究において参考になると思われる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
競合学習を用いることで、従来手法よりも優れた解に到達する方法を示すことができたことから、達成度は概ね当初の予定通りとした。これは今まで明らかになっていなかったことであり、実験で確かめられたことは大きな一歩であったと考える。また、競合学習を非負値行列因子分解に対応させるため、複数の代表ベクトル(代表ベクトルの部分集合)を勝者とし、学習させる新しいアルゴリズムを考案したことも、当初の目標に沿った成果である。ただし、この新アルゴリズムについては、従来の競合学習を用いない非負値行列因子分解よりも優れているが、「従来の競合学習」を用いた非負値因子分解の結果と比較した場合、到達した目的関数の値に差があるとはいえなかった。この点が今後の課題として残されている。
|
今後の研究の推進方策 |
研究実施計画に記載したように、初年度に取り組んだ「一般化KLダイバージェンスを目的関数とする場合」に加えて、様々な目的関数の場合のアルゴリズム検討に取り組む予定である。また、理論面だけではなく、実際のデータ(文書、行動ログ、マルチメディアデータ)などのビッグデータを対象として、アルゴリズムを適用して得られた結果から、ビジネス機会や業務上の問題点を発見することなどに使えないかを検討する。研究成果の国際会議への投稿、国内外の論文誌への投稿も行いたい。また、初年度において提案した新アルゴリズムについて、引き続き改良を試みる予定である。特に、エントロピーが小さな解(分布がコンパクトにまとまっている)が得られる傾向は重要であり、この性質が実用性と関係するのか、目的関数の最適化に影響を与えているのか、などを調べる考えである。
|
次年度使用額が生じた理由 |
当初考えていた対外発表の予定が少なくなったため、旅費に差額が生じた。その原因の一つは、従来手法の部分である「Multiplicativeアルゴリズム」の当初の実装が時間を要するものであったため、結果を得るのに最大1週間掛かり、検討していた国際会議への投稿を見送ったためである。最終的には最大30分程度で計算が完了する実装を見出したので、実験時間の問題は解消した。
|
次年度使用額の使用計画 |
次回の機会に投稿し、旅費についても当初の使用計画に沿った支出額になるようにつとめる。
|