研究課題/領域番号 |
24500282
|
研究機関 | 芝浦工業大学 |
研究代表者 |
神澤 雄智 芝浦工業大学, 工学部, 准教授 (00298176)
|
キーワード | クラスタ分析 |
研究概要 |
本研究の目的は、精度保証付き数値計算とその周辺の技法をクラスタ解析に導入し、主に初期値依存性問題を根本的に解決することと、データの不確実性を包括的に扱うことである。 初期値依存性問題については、可能性クラスタリングにおけるマウンテンクラスタリング的アプローチが全データを初期クラスタ中心として更新式を反復すると幾つかのクラスタ中心に集約することを踏まえて、一つ目のクラスタ中心が得られた際に精度保証付き数値計算技法を用いて収束半径を保証する手法を開発したが、期待に比べて保証された収束半径が小さいために計算効率化には寄与する見込みが薄いことを明らかにした。その一方、もう一度原点に立ち返ってファジィc-平均法の目的関数を見直した。エントロピー正則化ファジィc-平均法において余弦類似度を基にした最大化問題が提案されているのに対して、標準的ファジィc-平均法において余弦類似度を基にした最大化問題が提案されていないことに着目し、標準的ファジィc-平均法の目的関数をクリスプc-平均法の正則化という観点から改訂して、得られた最大化問題のカーネル化したものに対して2つの条件を仮定すると固有値問題に帰着されることから初期値問題を解決できる見込みがあることを明らかにした。 データの不確実性の包括的取扱いについては、線形計画法および二次計画法を用いた個体毎βスプレッドによる非ユークリッド関係性データクラスタリング、標準的ファジィc-平均法を正則化の観点から見直すことによって得られるべき乗正則化ファジィc-平均法と一般化標準的ファジィc-平均法、△不等式を基にした欠測関係性データの埋め込みによる共クラスタリング、カーネル解析に基づく関係性データの線形クラスタリングを開発した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初計画していた研究手法において、精度保証付き数値計算可能性クラスタリングについては開発を終えて実験を行っている状況だが効果は乏しい。その意味では進展しているとは言い難い。その一方で、本課題の一つである初期値依存性を解決するための別の手段を先の実験結果を精査する中で見い出した。これはエントロピー正則化ファジィc-平均法において余弦類似度を基にした最大化問題が提案されているのに対して、標準的ファジィc-平均法において余弦類似度を基にした最大化問題が提案されていないことに着目し、標準的ファジィc-平均法の目的関数をクリスプc-平均法の正則化という観点から改訂して、得られた最大化問題のカーネル化したものに対して2つの条件を仮定すると固有値問題に帰着されることから初期値問題を解決できる見込みがある。また、この研究手法はスペクトラルクラスタリングとの類似性が見られ、これまでクラスタリングに対する確率統計的アプローチやグラフ理論的アプローチが互いに密接な関係性が明らかにされているのに対してファジィ理論的アプローチだけが取り残されていた状況を打開するきっかけにもなると期待できる。その意味で総合的には概ね順調に進展していると言えるであろう。
|
今後の研究の推進方策 |
初期値依存性問題については、前年度に開発した新たな手法について、その性能を明らかにしていくと共に、スペクトラルクラスタリングや二乗相互情報量クラスタリングなどの、同じく固有値問題に落とし込む手法との関係性を明らかにしていく。このことから次年度以降にさらなる研究課題が産み出すことを模索していく。 不確実性の包括的取扱いについては、欠測値を埋め込むための従来的アプローチを根本から見直すと共に、機械区間やアフィン形式などの集合を用いて欠測値を欠測のまま取り扱うための技法を開発していく。
|
次年度の研究費の使用計画 |
見積もりに比べて旅費が若干安価で賄えたため。 次年度の物品や旅費に使用する予定である。
|