2008 Fiscal Year Annual Research Report
持続型テキスト分類学習のためのフィードバックナビゲーション
Project/Area Number |
18700084
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
岡部 正幸 Toyohashi University of Technology, 情報メディア基盤センター, 助教 (50362330)
|
Keywords | 制約付きクラスタリング / アクティブ学習 / スパムフィルタリング |
Research Abstract |
本年度は, Connectivityカーネルを利用した制約付きクラスタリング方法とアクティブ学習を利用したスパムフィルタリング方法についての研究を行った. Connectivityカーネルを利用した制約付きクラスタリングでは, 制約を利用してデータ間の距離を調節するアプローチに基づき, 具体的な調節方法としてConnectivityカーネルを利用する方法を提案した. また, 従来研究では不十分であったクラスタリングにおける効果的な制約選択方法について検討を行い, 意外性の基準に基づいた制約選択方法を提案した.実験を行った結果, カーネルの効果及び提案した制約選択方法の効果を確認することができた今後は本研究での基礎的な結果をもとに, 制約選択の効果について理論的な背景についても明らかにする必要がある. アクティブ学習を利用したスパムフィルタリングでは, スパムフィルタ学習におけるアクティブ学習の効果について調べた. スパムフィルタリングを行うには, フィルタの学習が欠かせないが, ユーザがある程度の数のスパムをシステムに教え込まねばならず, 負担を感じるユーザも少なからずある. このためアクティブ学習によりフィルタ学習に効果的なデータのみをユーザに判定してもらうことで, システムに教え込むデータ数をできるだけ抑えることが期待でき, ユーザの負荷の軽減につながる. 本研究では, Naive Bayesと期待損失に基づくデータ選択方法について実データを使用した実験を行い, アクティブ学習の効果を確認した.
|