2018 Fiscal Year Research-status Report
Study on k-means type clustering based on rough set theory
Project/Area Number |
17K12753
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
生方 誠希 大阪府立大学, 工学(系)研究科(研究院), 助教 (10755698)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | ソフトコンピューティング / ラフ集合理論 / ファジィ理論 / クラスタリング / k-means / Rough C-means / Rough set C-means / Rough membership C-means |
Outline of Annual Research Achievements |
本研究の第1年度にラフ集合に基づくk-means型クラスタリングの基礎理論として提案したRough Set C-Means (RSCM)法とRough Membership C-Means (RMCM)法について,2件の学術論文発表を行った.さらに,基礎理論の発展に関わる展開として,以下の成果を上げた. (1)RSCM法のクラスター中心決定法を確率的ラフ集合モデルの概念によって改良したProbabilistic RSCM法を提案し,より柔軟なクラスタリングを実現できることを示した.本成果について,1件の国内学会発表を行った. (2)RMCM法において,より詳細な近傍情報を活用するために,クリスプ二項関係をファジィ二項関係に拡張したRMCM法を提案し,クラスタリング精度の向上を示した.本成果について,1件の国内学会発表を行った. (3)対象の属するクラスの情報が部分的に得られている状況下で教師情報を活用して精度の高いクラスタリングを実行するために,半教師ありラフクラスタリングを提案し,その有効性を示した.本成果について,1件の国際会議発表,および1件の国内学会発表を行った. (4)ノイズの影響でクラスター構造を正確に抽出できなくなる問題に対処するため,Rough C-Means (RCM)法にノイズ除去機構を導入したNoise RCM法を提案し,クラスタリング精度の向上を示した.本成果について,1件の国内学会発表を行った. (5)対象と項目を同時にクラスタリングする共クラスタリングにおいて不確実性を考慮した手法について検討し,確率的・可能性的クラスタリング間を繋ぐ段階的可能性アプローチや,ビッグデータへの適用のためのミニバッチ最適化,クラスター数の自動推定法等を提案し,その有効性を示した.これらの成果について,1件の学術論文発表,2件の国際会議発表,および2件の国内学会発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
主に基礎理論の発展からの展開を図った第2年度としては,当初の研究の目的を十分に達成し,また,一部計画以上の成果を得た.以下に,個別の課題における達成状況を述べる. (1)当初,RSCM法に対して可変精度ラフ集合モデルの適用を予定していたが,第2年度では,可変精度ラフ集合を一般化した確率的ラフ集合モデルを適用して定式化を行った.これにより,より一般的かつ柔軟な手法を構築することができた.本成果は当初の予定からより発展させた内容であり,想定を超える成果が得られた. (2)ファジィ二項関係を導入したRMCM法を提案し,数値実験によりクラスタリング精度の向上を示した.この成果は当初に想定した目標を達成するものであった. (3)半教師ありラフクラスタリングを提案し,数値実験により,部分的にクラスラベル情報が与えられた状況下での性能向上を確認した.この成果は当初に想定した目標を達成するものであった. (4)ノイズ除去機構を導入したNoise RCM法を提案し,ノイズを含む実データにおけるクラスタリング精度の向上を示した.この成果は当初に想定した目標を達成するものであった. (5)共クラスタリングにおいて,段階的可能性アプローチ,ミニバッチ最適化,クラスター数自動推定を導入した.本成果は当初の予定には含まれないが,共クラスタリングの実用性を高めるものであり,想定を超える成果が得られた.一方で,共クラスタリングへのラフ集合理論の応用については未着手の状態に留まった.
|
Strategy for Future Research Activity |
当初の想定通り,最終年度である第3年度では,理論的・応用的側面の両面について展開を図る. 理論的側面については,提案手法であるGeneralized RCM (GRCM)法やRSCM法,RMCM法とそれらの発展手法において,実用性を高めるためのアプローチであるノイズ除去機構,半教師あり学習,クラスター数自動決定等の導入を進め,さらに,目的関数に基づく定式化および理論的発展を目指す.ラフクラスタリングにおいては対象空間を粒状化するための二項関係の構成方法が重要な役割を持つ.現在主に取り扱っている近傍ラフ集合モデルによる構成法以外の構成法についても検討および検証を行う. また,本研究のベースとなっているk-means法に類似したアプローチとして,クラスター中心をクラスター内誤差が最小となる対象によって決定するk-medoids法が提案されており,外れ値の影響を低減できることが報告されている.今後,ラフ集合に基づくk-medoids法についても定式化を行い,クラスタリング精度への効果を検証する. 応用的側面として,ラフクラスタリングの協調フィルタリングへの応用を検討する.協調フィルタリングでは,あるユーザに対し,嗜好が類似したユーザ群の情報を用いて,ユーザの嗜好にあったアイテムを推薦する.類似ユーザ群の発見にk-means法やFuzzy C-Means (FCM)法を用いるアプローチの有効性が報告されており,今後,ラフクラスタリングによる不確実性を考慮したユーザ群発見により,推薦性能の向上を目指す.さらに,実データを用いた数値実験により,その有効性を検証する. その他の応用として,ラフクラスタリングとファジィクラスタリングの融合や,ラフ集合に基づく共クラスタリングに関する応用を視野に入れる.さらに,医療データ等への適用も視野に入れ,基礎データの収集などを行い,実応用へ向けた検討を行う.
|
Causes of Carryover |
[理由] 提案手法に関わる数値実験を通常のパーソナルコンピュータで遂行できたため,当初購入を予定していたPCワークステーションを購入しなかったため.また,当初参加を予定していた国内学会・国際会議と実際の参加に変更があり,参加費・旅費等に変更が生じたため. [使用計画] 第3年度には本研究の集大成として,当初の計画より多くの学術論文発表,国内会議発表,国際会議発表を行う予定であり,それらの英文校閲料,論文投稿料,参加費,旅費等の費用に使用する予定である.
|