• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実績報告書

複数の指標による類似度を用いた再現率の高い学術論文検索システムの開発

研究課題

研究課題/領域番号 15K00310
研究機関株式会社富士通研究所

研究代表者

馬場 謙介  株式会社富士通研究所, その他部局等, 研究員(移行) (70380681)

研究分担者 南 俊朗  九州情報大学, 経営情報学部, 教授 (80315150)
研究期間 (年度) 2015-04-01 – 2018-03-31
キーワードデータマイニング / 計量書誌学 / 検索システム / 剽窃検知
研究実績の概要

学術研究でのサーベイ活動等において,急激に増加する学術論文に対する見落としの少ない,つまり,再現率の高い検索技術が求められる.本研究では,複数の指標に基づく学術論文間の類似性を利用し,再現率の高い学術論文検索システムを開発した.

平成29年度は「学術論文検索システムの実装と検証」を行った.検索システムのエンジン部分の開発に注力し,検証を行った.平成28年度までの研究成果により,学術論文間類似度の指標として,従来の指標に加え,学術論文本文に対する統計的解析により得られる語のベクトル表現を用いるべきであるという結論を得た.平成29年度は,これを用いて曖昧なパターン照合を高速に行う手法を開発した.また,この手法を実装し,剽窃検知としての効果の検証を行った.ここで,剽窃は単純なパターンの類似として定式化されているが,学術論文の局所的な類似に一般化できる.この手法は,単純な語の検索に語の出現の順序を加えたパターン検出において,同時に,語のベクトル表現により表現される語の意味を考慮することができる.

本研究の成果として,語の出現に加えて語の意味を考慮した,学術論文間の類似パターンを高速に検出するシステムを得た.この語の意味を表現するベクトル表現は,大量の文書データから機械学習的な解析によって得られ,応用先に応じて作成される.また,副次的な成果として,語のベクトル表現をランダムに決定することによって,単純なパターンの一致の網羅的な検出が,小さな領域によって実行可能であることが分かった.

  • 研究成果

    (12件)

すべて 2017

すべて 雑誌論文 (8件) (うち査読あり 8件、 オープンアクセス 1件) 学会発表 (4件) (うち国際学会 4件)

  • [雑誌論文] A Fast Algorithm for Plagiarism Detection in Large-scale Data2017

    • 著者名/発表者名
      Kensuke Baba
    • 雑誌名

      Journal of Digital Information Management

      巻: 15(6) ページ: 331-338

    • 査読あり / オープンアクセス
  • [雑誌論文] An extension of the FFT-based algorithm for the match-count problem to weighted scores2017

    • 著者名/発表者名
      Kensuke Baba
    • 雑誌名

      IEEJ Transactions on Electrical and Electronic Engineering

      巻: 12(S2) ページ: 97-100

    • DOI

      10.1002/tee.22554

    • 査読あり
  • [雑誌論文] Fast Plagiarism Detection Based on Simple Document Similarity2017

    • 著者名/発表者名
      Kensuke Baba
    • 雑誌名

      Proc. the Twelfth International Conference on Digital Information Management

      巻: 1 ページ: 54-58

    • DOI

      10.1109/ICDIM.2017.8244662

    • 査読あり
  • [雑誌論文] An acceleration of FFT-based algorithms for the match-count problem2017

    • 著者名/発表者名
      Kensuke Baba
    • 雑誌名

      Information Processing Letters

      巻: 125 ページ: 1-4

    • DOI

      10.1016/j.ipl.2017.04.013

    • 査読あり
  • [雑誌論文] Plagiarism detection using document similarity based on distributed representation2017

    • 著者名/発表者名
      Kensuke Baba, Tetsuya Nakatoh, and Toshiro Minami
    • 雑誌名

      Procedia Computer Science

      巻: 111 ページ: 382-387

    • DOI

      10.1016/j.procs.2017.06.038

    • 査読あり
  • [雑誌論文] Does Student’s Diligence to Study Relate to His/her Academic Performance?2017

    • 著者名/発表者名
      Toshiro Minami, Yoko Ohura, and Kensuke Baba
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 10387 ページ: 40-47

    • DOI

      10.1007/978-3-319-61845-6_5

    • 査読あり
  • [雑誌論文] Vector Representation of Words for Plagiarism Detection Based on String Matching2017

    • 著者名/発表者名
      Kensuke Baba, Tetsuya Nakatoh, and Toshiro Minami
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 10274 ページ: 341-350

    • DOI

      10.1007/978-3-319-58524-6_28

    • 査読あり
  • [雑誌論文] A Characterization of Student’s Viewpoint to Learning and its Application to Learning Assistance Framework2017

    • 著者名/発表者名
      Toshiro Minami, Yoko Ohura, and Kensuke Baba
    • 雑誌名

      Proc. the 9th International Conference on Computer Supported Education

      巻: 1 ページ: 619-630

    • DOI

      10.5220/0006389706190630

    • 査読あり
  • [学会発表] Fast Plagiarism Detection Based on Simple Document Similarity2017

    • 著者名/発表者名
      Kensuke Baba
    • 学会等名
      The Twelfth International Conference on Digital Information Management
    • 国際学会
  • [学会発表] Does Student’s Diligence to Study Relate to His/her Academic Performance?2017

    • 著者名/発表者名
      Toshiro Minami, Yoko Ohura, and Kensuke Baba
    • 学会等名
      The Second International Conference on Data Mining and Big Data
    • 国際学会
  • [学会発表] Vector Representation of Words for Plagiarism Detection Based on String Matching2017

    • 著者名/発表者名
      Kensuke Baba, Tetsuya Nakatoh, and Toshiro Minami
    • 学会等名
      The 19th International Conference on Human-Computer Interaction
    • 国際学会
  • [学会発表] A Characterization of Student’s Viewpoint to Learning and its Application to Learning Assistance Framework2017

    • 著者名/発表者名
      Toshiro Minami, Yoko Ohura, and Kensuke Baba
    • 学会等名
      The 9th International Conference on Computer Supported Education
    • 国際学会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi