2014 Fiscal Year Research-status Report
言語ベースクラスタリング技法の確立-モデルベースからの転換
Project/Area Number |
26330271
|
Research Institution | University of Tsukuba |
Principal Investigator |
遠藤 靖典 筑波大学, システム情報系, 教授 (10267396)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | クラスタリング / 言語ベース / モデルベース / データマイニング / ビッグデータ / ファジィ推論 |
Outline of Annual Research Achievements |
クラスタリングは特に有用なデータマイニング手法として、多くの分野で用いられている。しかし既存手法は、予め想定した数理モデルに沿ってクラスタリングを行うモデルベース技法なので、柔軟さに欠け、大規模・複雑・不確定で絶えず更新されるソーシャルデータのマイニングには不適である。そこで本研究課題では、モデルベース制御とファジィ制御の対比に着想を得、「モデルベースから言語ベースへ」という観点に立脚し、ソーシャルデータに対するマイニングをターゲットとした言語ベースクラスタリング(LC)技法の開発を目的とする。さらに、従来のモデルベースクラスタリング(MC)と開発手法との数理的関連性および、開発手法で適切に処理できるソーシャルデータの類型分類を通じて、LCの理論的発展およびソーシャルデータのマイニングへの実用化を目指す。 H26年度は申請書類に従い、以下に挙げる各研究内容について番号順に実施した。 1. 本研究課題全体の詳細計画を確認し、協力を仰ぐ専門家、研究補助者への連絡を行い、本年度全体の計画が速やかに行われるための体制を確立した。2. FCM、階層的クラスタリング等の代表的なMCアルゴリズムを実装し、計算時間や有効性の検討・問題点の抽出を行った。3. 実装したMCの基となっている数理モデルの抽出を行い、各アルゴリズムの問題点を理論的に検討した。4. クラスタリングと親和性の高い言語ベース(言語的記述の推論則)の構造に関する検討を行った。特にファジィ推論に着目し、ファジィ推論を用いたLCアルゴリズムを複数構築し、数件の国際会議発表を行った。5. クラスタの形状に基づく知識データベースの検討を始めた。6. 本年度の総括を行い、H27年度以降の全体計画を再検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
H26年度に予定していた研究計画の夫々について達成度の評価を、予定以上(A)、予定通り(B)、予定よりやや遅れている(C)、予定よりかなり遅れている(D)、の4段階で行う。 1. 研究全体の検討について、4月から8月頃にかけて行う予定だった。研究計画の詳細を確認し、複数の研究者との協力体制を確立することができた。(B)評価。2. 既存のクラスタリング技法の実装と検討について、5月頃から12月頃にかけて行う予定だった。FCM, 階層的クラスタリング等をはじめとする複数の代表的なアルゴリズムをPCに実装し、様々なデータを用いて計算時間や有効性の検討を行った。(B)評価。 3. 数理モデルの抽出・類型分類について、7月頃から3月頃にかけて行う予定だった。実装したアルゴリズムの数理モデルを検討し、類型に分類した上で、各アルゴリズムの問題点を理論的に検討した。(B)評価。4. 言語ベースの構造に関する検討について、11月頃からH27年度半ばにかけて行う予定だった。クラスタリングと親和性の高い言語ベースとしてファジィ推論に着目し、クラスタリングにファジィ推論を導入する際の種々の問題点について検討した後、ファジィ推論に基づく言語ベースクラスタリングのプロトタイプを複数構築した。また、それらのアルゴリズムをPC上に実装し、既存手法との比較検討を行った。(A)評価。5.知識データベースの構成について、必要に応じて、2月頃からH27年度半ばにかけて行う予定だった。球状、円柱状等、クラスタ形状に関する知識の、言語ベースクラスタリングへの実装に関する検討を始めた。(A)評価。6.本年度のまとめと来年度の全体計画について、2月頃から3月頃にかけて行う予定だった。H26年度の取りまとめを行い、H27年度の研究計画について検討を行った。予定以上に進んでいることを確認した。(A)評価。
|
Strategy for Future Research Activity |
H26年度は予定以上に研究計画が進んだが、それによって生じた時間的余裕に関しては今後の研究計画の遅延に対するバッファとして確保することとし、H27年度は以下のように、当初の予定通り遂行していくこととする。 1. 言語ベースの構造検討:H26年度に引き続き、クラスタリングと親和性の高い言語ベースの構造に関する検討および構築したプロトタイプの改善を継続して行う。2. 知識データベースの構成:H26年度より取り組んでいる、クラスタの形状に関する知識をアルゴリズムに実装するための知識データベースの構築について検討を行う。3.言語ベースクラスタリング技法の開発:検討した言語ベースの構造に基づいて、言語ベースクラスタリング技法の開発を行う。ここで構築する技法とは狭義の意味だけではなく、言語ベースクラスタリングのフレームワークも含めたものとなる。4.開発手法の検証・既存手法との比較検討:ベンチマークデータによる開発手法の検証と、既存手法との比較検討を行う。それにより、開発手法の特徴を把握することができる。もし思ったほどの結果が得られなかった場合、「言語ベースの構造の検討」、「もしくはクラスタリング技法の開発」に戻り、改めて考察し直すことになる。
|
Research Products
(18 results)
-
-
-
-
[Journal Article] On Linguistic-based Clustering2014
Author(s)
Akira Sugawara, Naohiko Kinoshita, Yasunori Endo
-
Journal Title
Proc. of The 2014 IEEE International Conference on Granular Computing (GrC 2014)
Volume: USB
Pages: 265-270
DOI
Peer Reviewed / Acknowledgement Compliant
-
-
-
-
-
-
-
-
-
-
-
-
-
-