• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

テキスト文書のグラフ変換に基づく侵害検知

研究課題

研究課題/領域番号 24800049
研究機関九州大学

研究代表者

周 秉慧  九州大学, システム情報科学研究院, 学術研究員 (50636793)

研究期間 (年度) 2012-08-31 – 2013-03-31
キーワード侵害検知 / グラフ変換 / グラフマッチング
研究概要

本研究の目標は,パラフレーズによる文書剽窃・侵害を検知するために,同じ意味をもつが語彙や語順が大いに異なる侵害文書を検出できる新しい検知手法を開発し,計算機システムとして実装し実データで提案手法の有効性を示すことである.本年度は,テキスト文書をグラフに変換しグラフマッチングに基づく検知手法を開発し,実文書データに適用してその性能を調べた.はじめに,単語間の文法関係を表現するために,物体間の関係を表すデータ構造であるグラフを使い,経験的なグラフ変換ルールを提案した.この変換手法は,文中の名詞と動詞/前置詞をそれぞれノードとエッジに変換し,テキストを直観に合うグラフ構造に変換する.提案手法により,同じ意味をもつ異なる文書を類似しているグラフ構造に変換できることを示した.次に,グラフ間の類似している部分グラフ構造を文書間の剽窃・侵害と見なし,グラフのinexactマッチング手法を開発した.自然言語表現の多様性を考慮した部分グラフ間の類似度を提案し,さらにその類似度に基づく発見アルゴリズムを開発した.提案した類似度では,WordNetという概念辞書を利用して単語の同義語と類義語を検出することにより,異なる語彙を使用した侵害文書を検出することができる.実テキストデータを使った実験では,提案手法は2種類の既存手法に比較して,最も高い適合率の値を示し再現率の値を10%向上した.

  • 研究成果

    (2件)

すべて 2013

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (1件)

  • [雑誌論文] Detecting academic plagiarism with graphs2013

    • 著者名/発表者名
      Bin-Hui Chou, Einoshin Suzuki
    • 雑誌名

      Extraction et gestion des connaissances (EGC'2013)

      巻: 1巻 ページ: 293-304

    • 査読あり
  • [学会発表] Detecting academic plagiarism with graphs2013

    • 著者名/発表者名
      Bin-Hui Chou
    • 学会等名
      Extraction et gestion des connaissances
    • 発表場所
      Toulouse, France
    • 年月日
      2013-01-31

URL: 

公開日: 2014-07-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi