2013 Fiscal Year Annual Research Report
Project/Area Number |
23300063
|
Research Institution | Central Research Institute of Electric Power Industry |
Principal Investigator |
小野田 崇 一般財団法人電力中央研究所, システム技術研究所, 副研究参事 (40371661)
|
Co-Investigator(Kenkyū-buntansha) |
山田 誠二 国立情報学研究所, コンテンツ科学研究系, 教授 (50220380)
|
Project Period (FY) |
2011-04-01 – 2015-03-31
|
Keywords | クラスタリング / 高次統計 / 知識発見 / データマイニング / HAI |
Research Abstract |
(1)「クラスタの再発見」フェーズの実現 前年度に「クラスタの発見」フェーズで開発したクラスタ内データの類似性が高く,クラスタ間の独立性が高いクラスタリング手法を,ユーザが与えるデータ間のmust-link,クラスタ間のmust-linkが扱える手法に改良した。この手法は,クラスタ内データの類似性が高く,クラスタ間の独立性が高いクラスタリングを得るためのアルゴリズムを,ユーザが指定したデータ間のmust-link,クラスタ間のmust-linkを制約条件として考慮できるアルゴリズムに改良したものである。具体的には,このアルゴリズムでは,ユーザが指定したデータ間のmust-link,クラスタ間のmust-linkを満たすクラスタ中心となる超平面を求め,それを初期値として,他の独立なクラスタから制約を満たす範囲で独立なクラスタ中心を求めている。 (2)ユーザ制約指定支援インタフェースの開発 前年度に,多次元空間でクラスタリングされた結果を,多次元空間上でのユークリッド距離の関係がある種保持された形で2次元空間上に射影する方法を開発し,クラスタ内データの類似性とクラスタ間の独立性が理解しやすい(見える化された)インタフェースを開発した。本年度は,このインタフェースを利用して,ユーザ制約であるデータA,B間のmust-link,クラスタA,B間のmust-linkを一対一の指定ではなく,ある程度まとめてmust-linkを指定できる認知負荷の少ない能動的なサンプリング方法を提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初計画していた複数制約を扱える制約付き同区立性の高いクラスタリングアルゴリズムの開発が遅れているため。概ね開発の目処はたっているので,研究を加速して進める。
|
Strategy for Future Research Activity |
開発手法はクラスタリングと言うより,独立な潜在情報の獲得と説明した方が理解しやすい。今後はLatent Semantic Analysis(潜在情報分析:LSA)に対するIndependent Semantic Analysis(独立情報分析:ISA)といして紹介していく。最終的には,インタフェース上でユーザが指定したmust-linkを制約が扱えるクラスタリング手法に取り込み,直ちにクラスタリング結果に反映させる必要があるため,統合方法が明確になるまでは,密に研究打合せ・議論を行っていく予定である。
|
Research Products
(5 results)