2017 Fiscal Year Research-status Report
Study on k-means type clustering based on rough set theory
Project/Area Number |
17K12753
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
生方 誠希 大阪府立大学, 工学(系)研究科(研究院), 助教 (10755698)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | ソフトコンピューティング / ラフ集合理論 / ファジィ理論 / クラスタリング / k-means法 / ラフC-means法 / ラフ集合C-means法 / ラフメンバシップC-means法 |
Outline of Annual Research Achievements |
本研究ではラフ集合理論に基づくk-means型クラスタリングの開発を通して,従来のk-means法やファジィクラスタリング法を凌駕する分類性能を実現することを目的としている.初年度は基礎理論の整備に関わる展開として,以下の成果を上げた. (1)ラフ集合理論の観点を導入したk-means型クラスタリングであるLRCM法とPRCM法を統合し,一般化ラフC-means(Generalized Rough C-Means, GRCM)法を定式化した.提案法はパラメータ調整によりLRCM法とPRCM法,およびその中間的な状態を表現できる.本成果について,1件の学術論文発表および2件の国内学会発表を行った. (2)二項関係に基づく空間の粒状性を考慮し,ラフ集合理論本来の下近似・上近似によりクラスターを大雑把に近似しながらクラスタリングを実行するラフ集合C-means(Rough Set C-Means, RSCM)法を提案し,分類境界の特性や不均衡データおける挙動について詳細な調査を行った.これらの成果について,2件の国際会議発表および1件の国内学会発表を行った. (3)上下近似を生成する過程で算出されるラフメンバシップ値を直接クラスターメンバシップとして利用する,ラフメンバシップC-means(Rough Membership C-Means, RMCM)法を提案し,理論的考察に加え,初期値依存性等について詳細な調査を行った.これらの成果について,1件の国際会議発表および1件の国内学会発表を行った. (4)ラフクラスタリングの研究に付随して,類似したアプローチであるファジィクラスタリングにおけるノイズクラスタリングや可能性的クラスタリングを,対象と項目を同時にグループ化する共クラスタリングの枠組みで応用的研究を展開した.これらの成果について,4件の国際会議発表および7件の国内学会発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
主に理論的側面からの展開を図った初年度としては,当初の研究の目的を十分に達成し,また,計画以上の成果を得た.以下に,個別の課題における達成状況を述べる. (1)ラフクラスタリングの分野では二大手法であるLRCM法とPRCM法について個々に研究が展開され,見通しが悪くなっていた.今回,GRCM法によって両手法を統合することで見通しが良くなり,本手法を基軸としてラフクラスタリング手法が統一的に展開されていく事が期待される.本成果は当初の予定には含まれないが,ラフクラスタリングの展開の基礎として極めて重要な位置づけであり,想定を超える成果が得られた. (2)RCM法およびRSCM法の分類境界を可視化し比較することでそれらの特性を明らかにした.RSCM法では異なる二項関係が異なるラフな分類を生成する.さらに,クラス比率や分散が偏った不均衡データにおけるRSCM法の分類特性を評価し,結果として,境界領域内のクラス比率が一定のルールに従って変化することが確認され,不均衡データを取り扱う際に注意すべき点が明らかになった.これらの成果は当初に想定した目標を達成するものであった. (3)RMCM法が二項関係に基づく近傍内条件付き確率を使用する点を考慮し,無差別の原理に基づく確率的メンバシップを利用するRCM(πRCM)法と比較して,提案法の理論的な優位性を明らかにした.さらに,RMCM法の初期値依存性を調査するため,メンバシップ値のランダムな初期化や非復元抽出によるクラスター中心の初期化,k-means++法による初期化を用いた比較実験を行い,k-means++法による初期化の有効性を示した.これらの成果は当初に想定した目標を達成するものであった. (4)当初の計画には含まれないが,ラフクラスタリングと関連の深いノイズクラスタリングや可能性的クラスタリングを,ファジィ共クラスタリングの枠組みで研究を展開した.これらの成果に関しては,想定を超える成果が得られた.
|
Strategy for Future Research Activity |
当初の想定通り,第2年度以降は,理論的・応用的側面の両面について展開を図る. 理論的側面については,初年度に開発したGRCM法,RSCM法,RMCM法において,可変精度ラフ集合モデルの適用,多様な二項関係の検証,特にファジィ二項関係の利用を検討し,さらに目的関数に基づくラフクラスタリングの定式化を目指す. 一方,応用的側面については,半教師あり学習の導入やクラスタ数の自動決定など,実用へ向けたアプローチの研究を推進し,実データを用いた数値実験により,その有用性を検証する.また,ラフクラスタリングとファジィクラスタリングを融合させることで,ノイズクラスタリングや可能性的クラスタリングの利点を活用することを考える.さらに,対象だけでなく項目も同時にグループ化する共クラスタリングへラフ集合理論を応用するなど,新たな展開も視野に入れる. そのほか,第3年次に向けては,医療データへの適用等も視野に入れ,基礎データの収集などを行っていく.
|
Causes of Carryover |
(理由) 平成29年度に掲載を計画して投稿していた雑誌論文について,査読日程の都合上,平成30年度に掲載される見込みとなったため. (使用計画) 平成30年度に掲載される雑誌論文の掲載料として使用する.
|