2009 Fiscal Year Annual Research Report
ファジィクラスタリングに基づくテキストデータの分析に関する研究
Project/Area Number |
20700214
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
本多 克宏 Osaka Prefecture University, 工学研究科, 准教授 (80332964)
|
Keywords | ソフトコンピューティング / ファジィクラスタリング / データ解析 / 知識発見 |
Research Abstract |
本研究では,非構造的なテキストデータから有益な情報を抽出することを課題とし,線形ファジィクラスタリング(局所的主成分分析)に基づく標本や変量の分類,視覚化などを通して,分析者が潜在的な相関ルールを直感的に理解することができる分析手法の開発を目的に研究を行っている.平成20年度に開発した基盤的技術の拡張として,平成21年度には以下の成果が得られた. 1.主成分分析に基づくk-Meansクラスタリング法に変量選択の機構を導入することで,決定論的な手順によってテキスト-単語マップ作成におけるキーワード選別が可能となることを示した.また,群構造の把握を目的とした変量選択が,平成20年度に有効性を確認した変量選択型線形ファジィクラスタリング法に基づく低次元視覚化と同等の意味を持つことを明らかにし,初期分割の影響を受けずに簡潔なテキストマップを作成できることを示した. 2.主成分分析に基づくk-Means法の決定論的なクラスタリング手順にノイズ除去の機構を導入することで,ノイズの影響を受けないロバストな群構造把握が可能となることを示した.また,テキスト文書間の関連を分析する際には,内容の類似したテキスト群の抽出が目的となるが,複数の群の境界に属するようなノイズ文書を無視しながら群ごとに核となる文書を強調することで,文書分析における構造把握に有効となることを明らかにした. 3.平成20年度に開発したテキスト文書間の関連が関係性データにより与えられる場合の低次元視覚化法において,視覚化に用いる低次元空間の次元数を決定するために新たな尺度を,ファジィ主座標分析の応用により開発し,多次元尺度構成法を多クラスター型に拡張した低次元視覚化法を確立した.
|