研究課題/領域番号 |
15K00348
|
研究機関 | 芝浦工業大学 |
研究代表者 |
神澤 雄智 芝浦工業大学, 工学部, 教授 (00298176)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | ファジィクラスタリング / 球面データ / 不完全データ |
研究実績の概要 |
クラスタリングは特に重要なデータ解析手法として、多くの分野で用いられている.本研究課題では,これまでに研究を推し進めてきた球面ファジィクラスタリングを実世界,実社会の現象や事象への適用を可能とするために,不完全データのための球面ファジィクラスタリング技法を確立することを目的にしている.具体的には,球面完全データに対する技法を確立した際に用いた方法論に基づいて,リニア完全化手法群のそれぞれに対応する球面完全化手法群を開発し,各開発手法の性能を実験を通じて評価し,開発手法と研究代表者のこれまでの研究成果を組み合わせて様々なデータに対する実験を通じて,リニアクラスタリングを精度面で凌駕する,不完全データのための球面ファジィクラスタリング技法を確立することである.平成28年度は,申請書に従い,以下に挙げる各研究内容について実施した.開発した手法と従来法の制度を定量的に比較するために,ベンチマーク用人工完全データ群から徐々に欠損箇所を増やしていくことによって得られる不完全データに対して,リニアクラスタリングと球面クラスタリングについて,欠損比率とクラスタリング精度との関係を明らかにすると共に,欠損箇所とクラスタリング精度との関係についても検証した.これによって,不完全データに対して,開発手法群を用いた球面クラスタリングとリニアクラスタリングとの精度面での優位性を明らかにできた.また,球面三角法に基づいて欠損値を予測する手法について開発し,球面主成分分析と多次元尺度構成法を,研究代表者がこれまで球面クラスタリング開発に用いてきたYoung-Householder変換に基づいて組み合わせ,類似度完全データを球面に直接附置するための球面構成法を開発した上で,不完全な類似度関係性データを球面に附置して得られる球面不完全データに対して,上記の球面完全化手法群を適用する手法を開発した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度に予定していた各研究計画について,それらの達成度評価を,予定以上(A),予定通り(B),予定よりやや遅れている(C),予定よりかなり遅れている(D),の4段階で行う. 1.開発した手法と従来法の制度を定量的に比較するために,ベンチマーク用人工完全データ群から徐々に欠損箇所を増やしていくことによって得られる不完全データに対して,リニアクラスタリングと球面クラスタリングについて,欠損比率とクラスタリング精度との関係を明らかにし,欠損箇所とクラスタリング精度との関係についても検証した.これによって,不完全データに対して,開発手法群を用いた球面クラスタリングとリニアクラスタリングとの精度面での優位性を明らかにできた.(B) 2.従来法がリニア空間における三角不等式に基づいて欠損値を予測していることを鑑みて本研究では航海術に用いられていた球面三角法に基づいて欠損値を予測する手法について開発した.(B) 3.球面主成分分析と多次元尺度構成法を,研究代表者がこれまで球面クラスタリング開発に用いてきたYoung-Householder変換に基づいて組み合わせ,類似度完全データを球面に直接附置するための球面構成法を開発した.これに基づいて,球面構成法を用いて不完全な類似度関係性データを球面に附置して得られる球面不完全データに対して,上記の通り開発してきた球面完全か手法群を適用する手法を開発した.(B)
|
今後の研究の推進方策 |
平成28年度は予定通りに研究計画を遂行した.平成29年度は以下のように,当初の予定通り遂行していくこととする. 【不完全部分を予測する際に確率分布を用いる手法群の開発・性能評価・比較】 リニア統計における完全情報最尤推定法と多重代入法に対応する球面完全化手法群を開発する.双方とも事前に欠損値の確率密度分布を決める必要があり,リニア統計では正規分布が仮定される.そこでまずは,球面統計において正規分布に対応するvon Mises-Fisher (vMF)分布を仮定して球面完全化法を開発する. 開発手法群の定量的性能を評価するために,手順1に基づいた実験を,開発手法群と従来法を定量的に比較するために手順2に基づいた実験を行う.完全情報最尤推定法はEMアルゴリズムに基づいていて,クラスタリングもまた混合密度分布の混合係数が道という意味でEMアルゴリズムの枠組みで論じられることがある.その意味では,完全化とクラスタリングを同時に行って,欠損値と混合係数を合わせた未知変数を解く手法も考えられ,研究代表者が開発した球面クラスタリング技法群をEMアルゴリズムの枠組みで見直して,欠損値も同時に得るアルゴリズムを開発する.研究代表者は,vMF分布に基づく球面クラスタリングがはずれ地に影響を受けるのに対して,球面Tsallis分布に基づいてはずれ地に頑健な球面クラスタリングを開発している.このことを踏まえて欠損値の適切な分布決定についても検討していく,このとき,完全情報最尤推定法については仮定する分布の共益事前ぷんぷが,多重代入法については予測事後分布が必要となり,正規分布以外の一般的な分布に対してこれらが明らかにならないことも予想される.その際には変分ベイズや経験ベイズのように禁じ法や乱数発生を援用する.
|
次年度使用額が生じた理由 |
当初は当該金額分について,年度末に学会投稿論文脱稿後の英文校閲に費やす予定していたが,提出締切りが延伸されたことに伴って脱稿日程を繰り下げたため,今年度に執行できなかった.
|
次年度使用額の使用計画 |
当初の予定通り,学会投稿論文の英文校閲に費やす.
|