2009 Fiscal Year Annual Research Report
Project/Area Number |
20700081
|
Research Institution | Chiba University |
Principal Investigator |
森 康久仁 Chiba University, 大学院・融合科学研究科, 助教 (40361414)
|
Keywords | 可視化 / 機械学習 / データマイニング / 特徴選択 |
Research Abstract |
本研究の目的は,観測したデータをその所属するカテゴリ(クラス)に適切に割り当てるパターン認識の問題において,大規模な問題に対する効果的なデータ解析手法の確立を目指すものである.パターン認識問題に対する現在のデータ解析において望まれることは,従来の方法論がそのまま適用できないような大規模な問題(カテゴリ数,特徴数,データ数が多い場合)に対して,十分効率良く,かつ高精度な解析が行えることである.この問題に対して,本研究で提案した手法は,1)One-Class SVMにおけるデータの部分集合化,2) グラフ表現によるデータ可視化,の2点に集約される.提案手法は,各データそのものを解析するのではなく,類似するデータを一つの塊として捉え,それらの情報を可視化する手段としてグラフ表現を用いて,データの構造を捉えようとするものである.本研究で提案した手法のプロトタイプを計算機上に実装し,実データに対して適用した.その結果,特にカテゴリ数,データ数が非常に多い場合,本研究で提案した手法によりクラス間の関係を解析者が直感的に理解することができた.大規模パターン認識問題を扱う場合,データの素性・特性を適切に捉えることが全体的な認識システムの性能向上にはかかせない.特に認識システムを構築する初期の段階では,本研究で対象とするような探索的なデータ解析は非常に重要な役割を持つ.本研究で提案した手法は,従来とは異なる観点から解析が行えるものとして,探索的データ解析方法の選択肢を増やすことができたという点から非常に意義のあるものである.
|