2012 Fiscal Year Research-status Report
精度保証付数値計算技法を用いたクラスタ解析の初期値依存性と不確実性の包括的取扱
Project/Area Number |
24500282
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Shibaura Institute of Technology |
Principal Investigator |
神澤 雄智 芝浦工業大学, 工学部, 准教授 (00298176)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | クラスタ分析 |
Research Abstract |
本研究の目的は、精度保証付き数値計算とその周辺の技法をクラスタ解析に導入し、主に初期値依存性問題を根本的に解決することと、データの不確実性を包括的に扱うことである。 初期値依存性問題については、単純なベクトルデータに対して厳密大域最適化アルゴリズムを開発することから始めた。標準的ファジィc-平均法に基づくアルゴリズムについては個体とクラスタ中心が一致した場合に特異な状況が発生し、これまでの近似計算では見過ごされてきた、厳密計算における問題点を明らかにした。エントロピー正則化ファジィ-平均法に基づくアルゴリズムについてはその定式化を完了して一応の実装を済ませたが、単純なデータに対してでさえも収束に至らなかった。これは擬似的な極値や鞍点が膨大に存在するためと予想しているが論拠ある考察までには至っていない。 不確実性の包括的取扱いについては、膨大なクラスタリングアルゴリズムの中でその対象となる手法を限定していく過程で、エントロピー正則化関係性ファジィc-平均法が非ユークリッド関係性データにもそのまま適用可能であることと、関係性ファジィc-平均法とカーネルファジィc-平均法が実際には同一の手法であることを明らかにし、これらを論文にまとめた。また、異種関係性クラスタリング手法が同種関係性クラスタリングの枠組みで議論できることを明らかにするなど幾つかの成果を国際会議で発表した。これらの成果により、膨大なクラスタリングアルゴリズムを幾つかの枠組みに集約化することができ、不確実性を導入していく準備が整いつつある。さらに、単純なデータに対する標準的ファジィc-平均法による結果だけではあるが、区間演算を用いることによってクラスタ境界において帰属度がファジィであるために一概にクリスプ化できないことを明らかにした。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
初期値依存性問題については当初、開発したアルゴリズムと従来法との実行時間比較までを計画していたが、標準的ファジィc-平均法に基づくアルゴリズムについては個体とクラスタ中心が一致した場合に特異な状況が発生し、これまでの近似計算では見過ごされてきた、厳密計算における問題点が明らかとなり、また、エントロピー正則化ファジィ-平均法に基づくアルゴリズムについてはその定式化を完了して一応の実装を済ませたが、単純なデータに対してでさえも収束に至らなかった。これは擬似的な極値や鞍点が膨大に存在するためと予想しているが論拠ある考察までには至っていない。この原因は、功を急いで、単純ではあるが初めから大規模データに取り組んだためであり、実行時間比較よりも前に収束可能なデータの規模を特定することの研究方針を追加せねばならない。一方で、研究開始当初はクラスタ結果を解釈するのが難しい緩和解を得るだけのスペクトラルクラスタリングについて、ファジィクラスタリングからの新しい解釈が可能であることが分かってきたため、これを推し進めることによって確立したアルゴリズムに精度保証付き数値計算技法を導入することによって初期値依存性問題を一挙に解決できる可能性がある。 不確実性の包括的取扱いについては当初、分枝過程で区間データが分けられた小区間をマージするアルゴリズムを開発することを計画していたがそこまでに至っていない。しかしながら、当初は膨大なクラスタリングアルゴリズムを個別に研究していくこと計画していた一方で、その準備段階で幾つかの枠組みに集約化することができたため、長期計画的には概ね順調に進展していると判断する。
|
Strategy for Future Research Activity |
初期値依存性問題については、引き続き従来アルゴリズムとの実行時間比較に向け、標準的ファジィc-平均法に基づくアルゴリズムについては、特異性を排除するための何らかの正則化手法を模索し、エントロピー正則化手法については実行時間比較の前に、開発したアルゴリズムで収束可能なデータ規模を特定していく。また、可能性クラスタリングとノイズクラスタリングをそれぞれ用いたクラスタ逐次抽出アルゴリズムについては精度保証付き数値計算技法を用いて初期値依存性に伴う計算量爆発を軽減するアルゴリズムを開発していく。さらに、クラスタ結果を解釈するのが難しい緩和解を得るだけと思われてきたスペクトラルクラスタリングについて、ファジィクラスタリングからの新しい解釈を推し進めてアルゴリズムを確立し、これに精度保証付き数値計算技法を導入することを検討していく。 不確実性の包括的取扱いについては、本年度に引き続いて膨大なクラスタリングアルゴリズムの集約化を推し進めると共に、既に集約化が一段落した枠組みについては実際に不確実性を考慮したアルゴリズムを実装して動作を検証していく。集約化については、標準的ファジィc-平均法とエントロピー正則化ファジィc-平均法の関係から導かれる一般化ファジィ-平均法の枠組みを確立し、非ユークリッド関係性ファジィクラスタリングの一般化を検討していく。不確実性を考慮したアルゴリズムについては関係性ファジィc-平均法に区間演算を導入していく。
|
Expenditure Plans for the Next FY Research Funding |
主な研究費用途は、実験用計算機の導入と研究成果発表に伴う費用である。 本年度の実験において32bit計算機では実験遂行に必要な記憶容量に限界を感じているため、新たに64bit計算機を2~3台導入して再実験を行う。ソフトウエアについては無料の基本ソフトウエア・開発環境・コンパイラ・デバッガを用いることを計画しており費用は発生しない。 研究成果発表に伴う費用については、これまでに得られている研究成果をとりまとめて学術論文誌において発表するための投稿料と新たに得られるであろう成果を国際会議や国内学会において発表するための参加費および旅費である。非ユークリッド関係性ファジィクラスタリングの一般化については学術論文誌JACIIIに投稿予定である。初期値依存性問題に係る実験結果、および、可能性クラスタリングとノイズクラスタリングをそれぞれ用いたクラスタ逐次抽出アルゴリズムへの精度保証付き数値計算技法の導入については国内学会ファジィワークショップにて発表を予定している。スペクトラルクラスタリングとファジィクラスタリングとの関係から導かれるアルゴリズムについては国内学会ファジィシステムシンポジウムにて発表を予定している。また、標準的ファジィc-平均法とエントロピー正則化ファジィc-平均法の関係から導かれる一般化ファジィ-平均法の枠組みについては国際会議MDAI2013にて、非ユークリッド関係性ファジィクラスタリングのさらなる一般化については国際会議KSE2013にて発表を予定している。
|