研究課題/領域番号 |
23500269
|
研究機関 | 筑波大学 |
研究代表者 |
宮本 定明 筑波大学, システム情報系, 教授 (60143179)
|
キーワード | クラスタリング / 半教師付き分類 / 階層的技法 / 2段階クラスタリング / 混合分布モデル / ファジィクラスタリング / 非対称データ |
研究概要 |
(1)制約クラスタリング技法開発の継続と制約混合分布モデルとの性能比較:制約付きカーネル法の提案と展開など、アルゴリズムの開発を続行し、公開されている標準データなど、多様なデータセットを用いて性能比較を行った。その結果、2段階アルゴリズムの高度化と多量のデータの扱いに成功した。また、本手法が混合分布モデルとほぼ同等の性能をもち、非線形境界をもつデータについては、より優れた性能を示すことを明らかにした。この成果はSCIS2012国際学会等で発表を行った。 (2)目的関数修正法の適用:目的関数修正法は、制約のペナルティ項導入とは異なる半教師付き技法であるが、これについては、制約付きクラスタリングよりも性能が優れているとはいえないことがほぼ明らかとなった。一方、半教師付きガウス混合分布モデルと半教師付きfuzzy c-meansとが等価な解を与えることを示し、理論的にfuzzy c-meansが半教師付きガウス混合分布モデルよりも一般的であることを示した。この成果は、MDAI2012国際会議における招待講演等で発表した。 (3)ファジィ近傍カーネルモデルのweb情報解析とテキスト解析への応用:Twitter等の情報およびテキスト解析を本モデルにより行い、本モデルが従来のバッグモデルよりも効果的である場合を示した。成果はWCCI2012国際学会等において発表した。 上記(1)~(3)はほぼ計画通りであるが、さらに進んで、より広いクラスの技法、特に非対称データに対する半教師付き技法を考察した。また、半教師付きクラスタリングにおいて新たな中心的概念として、インダクティブクラスタリングの概念をIEEE GrC 2012国際学会において提唱した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
上に述べたように、24年度の成果として基本的に研究すると宣言した内容をすべて遂行した。ここで提案した手法は既存手法に少なくとも匹敵し、場合によってはoutperformすることを様々な数値例、実データによる解析例によって示した。さらに25年度の成果として予想したものの過半を2012年度に発表した。これらは、(1)より広いクラスの技法との比較検討、(2)半教師付きクラスタリングの概念確立、の2項目である。 (2)の項目については、本研究で中心的となるインダクティブクラスタリングの概念をIEEE International Conference on Granular Computing 2012国際学会における基調講演で提唱し、同学会から貢献賞を受賞した。24年度の成果には2件の基調講演(IEEE GrC 2012、JCS-CLADAG 2012)および1件の招待講演(MDAI 2012)が含まれ、研究内容は研究期間内に得られると予想した水準を既に超えている。これらのことから、当初の計画より大幅な進展がみられていると自己評価して差し支えないものと思われる。
|
今後の研究の推進方策 |
最終年度については、研究のまとめを中心とするとともに、ここで提案した技法の中心的概念であるインダクティブクラスタリングとノンインダクティブクラスタリングの違いおよび有用性について考察を深める。また、非対称データの取り扱いは、web情報のマイニングという観点から近年急に注目されているが、この技法の研究を半教師付き非対称データクラスタリングとして進める。 また、規模の大きいデータに対する効率の良い技法の研究を更に進めていく。 本研究で開発した技法をとりまとめ、webページやSNS、レポジトリ等を通じて情報発信を行う。
|
次年度の研究費の使用計画 |
最終年度には、これまで得られた成果の発表を行うための旅費と学会参加費、さらに論文発表のための費用を中心として研究費を使用する。これに際して、計算機周りの消耗品や、情報発信やwebページ、開発したプログラムの整理と公表などのため、謝金を使用する。
|