研究概要 |
本研究は,大規模なデータベースからの知識発見への新たなアプローチとして,質的な変量を含むデータ集合から局所的な知識を見出すための計算アルゴリズムを開発することを目的としている.平成15年度には,最小2乗基準を用いた不完全データのための線形クラスタリングと数量化分析の一種である等質性分析における目的関数の類似性に着目し,個体を分類しながら局所的な特徴をよく表す数量的得点を与える手法を提案した.平成16年度に行った成果は以下のとおりである. 1.多くの質問項目から関連の深い組を抽出するために,前年度に提案した不完全データのための局所的な数量化分析に項目分類のためのメンバシップを導入したモデルを提案し,知識発見のための情報を持たない項目を削除しながら低次元散布図を作成できることを示した^*. 2.最小2乗基準を用いた線形クラスタリングにおける欠測値の処理法の応用として,欠測値に対する重みをロバスト推定の一種であるM推定の重みと置き換えることにより,欠測値と同時にサンプル内ノイズを処理する手法を提案し,コンテンツ推薦システムへの応用を試みた^<**>.1の知見との組み合わせにより,自然言語に基づく推薦システムへの発展が可能となる. 3.^*は第14回インテリジェントシステムシンポジウムにおける発表論文で以下のとおり. 個体と項目の分割を考慮した局所的な数量化分析法,講演論文集,249-250 4.^<**>はInternational Journal of Approximate Reasoningにおける発表論文で以下のとおり. Component-wise Robust Linear Fuzzy Clustering for Collaborative Filtering,37,2,127-144
|