2006 年度実績報告書

持続型テキスト分類学習のためのフィードバックナビゲーション

研究課題

研究課題/領域番号	18700084
研究機関	豊橋技術科学大学
研究代表者	岡部正幸豊橋技術科学大学, 情報メディア基盤センター, 助教 (50362330)
キーワード	トランスダクティブ学習 / クエリ拡張 / 文字列解析 / 異常発見
研究概要	本年度は,主に2つのテーマに関する研究を行った. 「トランスダクティブ学習による最小文書判定からのクエリ拡張」に関する研究では,情報検索を行う際のユーザフィードバックとして適合文書が1つ見つかるまでの最小文書判定情報しか与えられない場合に有効に機能するクエリ拡張方法を提案した.提案手法の特徴は,最小のフィードバック情報から適合文書である可能性の高い他の文書を見つけ出すためにトランスダクティブ学習のSGTアルゴリズムを利用する点と単語のスコア計算を行う際に不足する統計情報を補うため複数の学習結果を重ね合わせて単語のスコア計算を行う点にある.実験において標準的な手動フィードバック型,擬似フィードバック型クエリ拡張方法と比較した結果,提案手法は初期検索結果が良くない場合に効果を発揮することが分かった. また,「文字列解析に基づくネットワークトラフィックデータからの異常発見」に関する研究では,ネットワーク上の異常トラフィックを,時系列データの文字列表現手法を用いて検出する方法を提案した.文字列表現による異常発見方法としてマルコフモデルによる方法が既に提案されているが,ネットワークデータに適用した場合,誤検知が多く,これをそのまま使用すると発見効率が悪い.このため,マルコフモデルによって列挙された文字列集合にクラスタリングによるはずれ値検出手法を適用することで,誤検知を取り除く方法を提案した.実際にトラフィックデータを使用した実験を行った結果,提案手法の有効性を示すことができた.

研究成果
(2件)

すべて雑誌論文 (2件)

[雑誌論文] トランスダクティブ学習による最小文書判定からのクエリ拡張2006
- 著者名/発表者名
  岡部正幸, 山田誠二
- 雑誌名
  
  人工知能学会論文誌 Vol.21,No.4
  
  ページ: 398-405
[雑誌論文] 文字列解析に基づくネットワークトラフィックデータからの異常発見2006
- 著者名/発表者名
  岡部正幸, 三輪多恵子, 梅村恭二
- 雑誌名
  
  インターネットカンファレンス予稿集
  
  ページ: 67-74