研究概要 |
本研究では, 非構造的なテキストデータから有益な情報を抽出することを課題とし, 線形ファジィクラスタリング(局所的主成分分析)に基づく標本や変量の分類,視覚化などを通して, 分析者が潜在的な相関ルールを直感的に理解することができる分析手法の開発を目的に研究を行っている. 平成20年度に得られた成果は以下のとおりである. 1. 先行研究で開発した変量選択型線形ファジィクラスタリング法をテキスト文書-キーワードの共起関係データに応用することで, テキスト文書間の関連を強調して視覚化するためのキーワード選別が可能となることを示した. また, 単一のテキストー単語マップでは構造の把握が困難なデータについて, 複数のマップを構築することで直観的な構造把握が可能となることを示した. 2. テキスト文書間の関連が類似性尺度などの関係性データにより与えられる場合の低次元視覚化法として, 標本のいずれかをプロトタイプに用いて低次元座標空間を構成する手法を開発した. 座標値が与えられない場合の低次元マップの作成に有効であることを確認した. 3. キーワードなどの名義尺度をカテゴリー変量として扱い, 量的変量と組み合わせてスイッチング回帰に応用するために, 最適尺度法に基づくカテゴリー変量の数量化機構を組み込んだ手法を開発した. また, クラスター形状の適応的な変化の機構を融合することで, 未来の事象の予測におけるカテゴリー変量の役割(予測可能性重視かモデルの理解可能性重視か)の自動選別が可能であることを示した.
|