2014 Fiscal Year Annual Research Report
ラフ集合理論の属性縮約に基づいた非類似度によるクラスター分析
Project/Area Number |
23700265
|
Research Institution | Osaka University |
Principal Investigator |
楠木 祥文 大阪大学, 工学(系)研究科(研究院), 助教 (30588322)
|
Project Period (FY) |
2011-04-28 – 2015-03-31
|
Keywords | 機械学習 / データマイニング / ソフトコンピューティング |
Outline of Annual Research Achievements |
平成26年度では,前年度から研究対象としているカーネル関数を整理して,「論理関数」と「カーネル法」を合わせたデータ解析手法として見直した.本研究では,分析するデータは名義的・離散的な属性値によって記述された対象の集合で与えられ,ラベル情報や制約条件などを用いて,有用なモデルをデータから抽出することを目的とする.このとき,モデルをパターン(属性値の組み合わせ)の重み付き和によって与える.パターンを扱うために論理ベクトル空間(パターン空間)を導入し,対象やパターンを論理ベクトルに対応させる.さらに,ラベル情報などはパターン空間の制限やそれ上の重みとして導入される.パターンの総数は入力データの大きさに対して指数的に増加するが,この困難さを克服するために,カーネル法を用いて分類モデルを構築する.カーネル法とは,各データ対の内積を要素に持つ行列(カーネル行列)を用いて,線形識別関数などを暗に構成する方法である.カーネルの計算方法を工夫して,データ数が数千程度までは計算できるようにした.提案したデータ解析手法を,「制約付きクラスタリング」と「部分定義論理関数の拡張」に応用した.クラスタリングとは,データから自然なグループ(クラスター)を見つけ出す手法である.これに加えて,異なるクラスターに分離されるべき対象の対を制約として与える.制約は論理関数としてモデル化されカーネル関数に反映される.ベンチマークデータでは,提案手法によって正しいクラスターを求めることができた.部分定義論理関数の拡張とは,部分的に与えられた真ベクトルの集合と偽ベクトルの集合から,それに適合する論理関数を求める問題である.与えられた真・偽ベクトルの情報からパターン空間を制限し,カーネル法によって,真・偽ベクトルを識別する関数を求めた.パターン空間を制限することによって,真の論理関数を推定する精度が向上した.
|
Research Products
(6 results)