Research Abstract |
平成21年度は,我々の提案するインタラクティブ情報収集を実現するための必須の要素技術である,少ない制約で高精度を達成する制約クラスタリングアルゴリズムの開発とユーザからの制約獲得に適したGUI(グラフィカルユーザインタフェース)の開発を中心に行った. まず,制約クラスタリングアルゴリズムの開発においては,現在もっとも有望なクラスタリングアルゴリズムであるスペクトラルクラスタリングに,制約を導入したアルゴリズムを開発した.具体的には,Must-link, Cannot-linkの近傍データに類似の制約を伝播させ,ごく少数の制約でも効率よく高精度の制約クラスタリングを実現するアルゴリズムを開発した.そして,そのアルゴリズムを元に,UCIディポジトリ等のテストベッドデータを用いて制約なしクラスタリング,制約伝播なし制約クラスタリングなどのベースラインシステムとの実験的性能比較を行い,提案した制約クラスタリングアルゴリズムの良好な結果を得た.また,K-meansなどのクラスタリングアルゴリズムで問題となる,クラスタリング数と同じ数のシードの決定問題について,独立成分分析で得られた成分をシードとするアプローチを実装した. 次に,低い認知的負荷で制約を人間に与えてもらうためのGUIを開発した.具体的には,スニペットベースの表現を用い,まず基礎研究として,スニペットとキーワードリスト,元の文とで,2つの文書の類似度を判定する比較実験を行い,スニペットの優位性を示した.さらに,共通部分,差分を強調したGUIを開発した.
|