2012 Fiscal Year Annual Research Report
Project/Area Number |
23300063
|
Research Institution | Central Research Institute of Electric Power Industry |
Principal Investigator |
小野田 崇 一般財団法人電力中央研究所, システム技術研究所, 副研究参事 (40371661)
|
Co-Investigator(Kenkyū-buntansha) |
山田 誠二 国立情報学研究所, コンテンツ科学研究系, 教授 (50220380)
|
Project Period (FY) |
2011-04-01 – 2015-03-31
|
Keywords | クラスタリング / 高次統計 / 知識発見 / データマイニング / HAI |
Research Abstract |
開発クラスタリング手法の特徴分析: 「クラスタの発見」フェーズで(昨年度)開発したクラスタ内データの類似性が高く,クラスタ間の独立性が高いクラスタリング手法を人工的に作成した様々なデータに適用し,開発クラスタリング手法はオーバーラップが存在するようなデータのクラスタリングに有利であることを示した。また,UCI repository, CLUTO などのベンチマークデータに開発クラスタリング手法を適用し,他のクラスタリング手法との相違点,データによる有利不利等を検討した。さらに,1989年,1990年のLos Angeles Timesベンチマークデータに提案クラスタリング手法とk-means法を適用し,オーバーラップの多い新聞情報においては,提案方法がk-means法より適切なクラスタを発見できることを示した。 独立性を強調したユーザ制約発見支援インタフェースの開発: 平成24年度には,昨年度開発した射影方法に基づき,各クラスタのデータ間の関連が理解しやすいインタフェースを開発し,ユーザのmust-link発見を支援した。本インタフェースでは,データ間のユークリッド距離をできるだけ維持しながら,主成分の2つの組み合わせによる2次元上のマップにデータを射影した状況を見ることができ,データ全体を見ていては気付かなかったmust-linkをユーザに気付かせるきっかけを与える。ベンチマークデータに対し,計算機だけによる能動学習と本インタフェースを利用して人間と計算機との協調による能動学習実験を行ったところ,本インタフェースを用いた場合の方が,早く正解クラスタを発見できることが確認できた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画していたクラスタ間の独立性を重視したクラスタリング手法の特徴が示せたこと,データを2次元上に配置するインタフェースによって,ユーザからのmust-link抽出を容易にすることが実現できたことを考えると,おおむね順調に進展していると判断する。
|
Strategy for Future Research Activity |
クラスタリング手法の開発では,ユーザが与えるmust-link制約を扱える改良を行い,インタフェースの開発では,ユーザがある程度の数のmust-linkを簡単に指定できるような改良を行う。最終的には,インタフェース上でユーザが指定したmust-linkを制約が扱えるクラスタリング手法に取り込み,直ちにクラスタリング結果に反映させる必要があるため,統合方法が明確になるまでは,密に研究打合せ・議論を行っていく予定である。
|
Research Products
(9 results)