2008 Fiscal Year Annual Research Report
レート歪み理論に基づく学習とその高度なクラスタ解析への応用に関する研究
Project/Area Number |
20700132
|
Research Institution | Gunma University |
Principal Investigator |
安藤 晋 Gunma University, 大学院・工学研究科, 助教 (70401685)
|
Keywords | レート歪み理論 / データ圧縮 / クラスタリング / 転移学習 / 時系列クラスタリング / 外れ値検出 |
Research Abstract |
本課題では20年度の実施計画に基づきRD学習の理論を拡張し, 訓練データと検証データの分布が独立かつ均一でない場合の学習, 転移学習におけるクラスタリングに応用する方法論を構築した. この結果, 従来なかった転移学習問題における教師無し学習手法を実現し, 異なる構成の文書集合から従来手法よりもはるかに効果的な精度や再現率で文書クラスタを特定できることを示した. この成果をデータマイニング分野の主要な国際会議であるICDMにて発表した. 続いて, RD学習を時系列データの主要なモデル(線形回帰モデル・多変量自己回帰モデル)に適用するための定式化を行った外れ値を含む回帰時系列や遺伝子発現ネットワークのモデルを元に生成した人工データを生成して手法の評価を行った, その結果, 従来手法よりもはるかに効果的な精度や再現率で時系列外れ値や動的システムの特異状態を検出できることが確認できた. この成果を知識発見・データマイニング分野の主要な国際会議であるKDDに投稿し, 採択された. 加えて, RD学習の拡張に基づいて, ラベル数が大きく偏ったりクラス毎の特殊性が存在するImbalanced学習問題において有効な一クラスバギング分類の手法を開発した. 手法の評価の準備としてユーザ・アイテムプロファイルおよび大規模なCRMデータの整備を行った.
|