• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模テキストデータ中の部分構造と稀少な複合パタンの階層的な発見

研究課題

研究課題/領域番号 24300059
研究種目

基盤研究(B)

配分区分一部基金
応募区分一般
研究分野 知能情報学
研究機関九州大学

研究代表者

池田 大輔  九州大学, システム情報科学研究科(研究院, 准教授 (00294992)

研究分担者 中藤 哲也  九州大学, 情報基盤研究開発センター, 助教 (20253502)
山田 泰寛  島根大学, 大学院総合理工学研究科, 助教 (50529609)
連携研究者 馬場 謙介  九州大学, 附属図書館, 准教授 (70380681)
研究期間 (年度) 2012-04-01 – 2015-03-31
研究課題ステータス 完了 (2014年度)
配分額 *注記
9,230千円 (直接経費: 7,100千円、間接経費: 2,130千円)
2014年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2013年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2012年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
キーワード例外文字列パタン / 純度の高いパタン / purity measure / テキストマイニング / 稀少パタン発見 / 例外パタン / 近似文字列照合 / purity / 希少パタン発見
研究成果の概要

本研究では、テキストデータ中の頻出な部分構造を組み合わせた非頻出なパタン発見の研究を行う。テキストにはZipf則があり、非頻出なパタン候補は無数にあるが、頻出なパタンを組み合わせたパタンの頻度が相対的に多い(絶対的には少ない)ものを発見することで、意味のある非頻出なパタン=稀少パタンを発見する。
このため、既に構築した例外文字列発見の枠組みを拡張と、新たに提案した「純度が高いパタン(pure pattern)」の枠組みで研究を行った。両者とも、細菌のゲノム配列におけるパタン発見での有効性を確認し、さらに、位置情報を持つブログデータやコンテキストの表現、学術論文への関連語発見等への適用も行った。

報告書

(4件)
  • 2014 実績報告書   研究成果報告書 ( PDF )
  • 2013 実績報告書
  • 2012 実績報告書
  • 研究成果

    (16件)

すべて 2015 2014 2013 2012

すべて 雑誌論文 (8件) (うち査読あり 8件) 学会発表 (8件)

  • [雑誌論文] テキストに対するPurity尺度の適用と改良2014

    • 著者名/発表者名
      谷口雄太,池田大輔
    • 雑誌名

      システム情報科学紀要

      巻: 19 ページ: 1-6

    • NAID

      120005475449

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] The Purity Measure for Genomic Regions Leads to Horizontally Transferred Genes2013

    • 著者名/発表者名
      Yuta Taniguchi, Yasuhiro Yamada, Osamu Maruyama, Satru Kuhara, and Daisuke Ikeda
    • 雑誌名

      Journal of Bioinformatics and Computational Biology

      巻: 11(6):1343002 号: 06 ページ: 1343002-1343002

    • DOI

      10.1142/s0219720013430026

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Finding Peculiar Compositions of Two Frequent Strings with Background Texts2013

    • 著者名/発表者名
      Daisuke Ikeda and Einoshin Suzuki
    • 雑誌名

      Journal of Knowledge and Information Systems

      巻: Online First 号: 2 ページ: 499-530

    • DOI

      10.1007/s10115-013-0688-9

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Preliminary Results for Discovering Related Words from Logs of Scholarly Repositories2013

    • 著者名/発表者名
      Takehiro Shiraishi, Toshihiro Aoyama, Kazutsuna Yamaji, Takao Namiki, and Daisuke Ikeda
    • 雑誌名

      Proceedings of IIAI International Conference on Advanced Information Technologies

      巻: CDROM

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Speed Improvement of the Plagiarism Detection Method2013

    • 著者名/発表者名
      Tetsuya Nakatoh, Kensuke Baba, Yasuhiro Yamada, and Daisuke Ikeda
    • 雑誌名

      Proceedings of IIAI International Conference on Advanced Information Technologies

      巻: CDROM

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Mining Infrequent Patterns of Two Frequent Substrings from a Single Set of Biological Sequences2013

    • 著者名/発表者名
      Daisuke Ikeda
    • 雑誌名

      Proceedings of the 2013 International Conference on Parallel and Distributed Processing Techniques and Applications

      巻: I ページ: 136-142

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Infrequent, Unexpected, and Contrast Pattern Discovery from Bacterial Genomes by Genome-wide Comparative Analysis2013

    • 著者名/発表者名
      Daisuke Ikeda. Osamu Maruyama and Satoru Kuhara
    • 雑誌名

      Proceedings of the 4th International Conference on Bioinformatics Models, Methods and Algorithms

      ページ: 308-311

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Mining Pure Patterns in Texts2012

    • 著者名/発表者名
      Yasuhiro Yamada, Tetsuya Nakatoh, Kensuke Baba and Daisuke Ikeda
    • 雑誌名

      Proceedings of the 2012 IIAI International Conference on Advanced Applied Informatics

      ページ: 285-290

    • DOI

      10.1109/iiai-aai.2012.75

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [学会発表] Unique Links as Weak Ties2015

    • 著者名/発表者名
      Yasuhiro Yamada, Daisuke Ikeda and Sachio Hirokawa
    • 学会等名
      4th International Congress on Advanced Applied Informatics
    • 発表場所
      岡山
    • 年月日
      2015-07-12 – 2015-07-16
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Discover Overlapping Topical Regions by Geo-semantic Clustering of Tweets'', Proceedings of the Eighth International Symposium on Mining and Web2015

    • 著者名/発表者名
      Yuta Taniguchi, Daiki Monzen, Sari Ariestien Lutfiana, Daisuke Ikeda
    • 学会等名
      Workshop of 29th International Conference on Advanced Information Networking and Applications
    • 発表場所
      Gwangju, Korea
    • 年月日
      2015-03-25 – 2015-03-27
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Probabilistic Model for Purity Values of Bacterial Genome Sequences2015

    • 著者名/発表者名
      Y. Taniguchi, R. Masui, T. Aoyama and D. Ikeda
    • 学会等名
      3rd International Conference on Bioinformatics and Computational Biology
    • 発表場所
      Hong Kong
    • 年月日
      2015-03-12 – 2015-03-13
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 近似文字列照合を用いた剽窃検出手法の評価2014

    • 著者名/発表者名
      中藤 哲也, 山田 泰寛, 馬場 健介, 池田 大輔, 廣川 佐千男
    • 学会等名
      平成25年度電気関係学会九州支部連合大会(第66回連合大会)
    • 発表場所
      鹿児島大学
    • 年月日
      2014-09-18
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Infrequent, Unexpected, and Contrast Pattern Discovery from Bacterial Genomes by Genome-wide Comparative Analysis2013

    • 著者名/発表者名
      池田大輔
    • 学会等名
      International Conference on Bioinformatics Models, Methods, Algorithms
    • 発表場所
      バルセロナ(スペイン)
    • 年月日
      2013-02-12
    • 関連する報告書
      2012 実績報告書
  • [学会発表] The Purity Measure for Genomic Regions Leads to Horizontally Transferred Genes2013

    • 著者名/発表者名
      Yuta Taniguchi, Yasuhiro Yamada, Osamu Maruyama, Satru Kuhara, and Daisuke Ikeda
    • 学会等名
      International Conference on Genome Informatics
    • 発表場所
      シンガポール
    • 関連する報告書
      2013 実績報告書
  • [学会発表] Mining Infrequent Patterns of Two Frequent Substrings from a Single Set of Biological Sequences2013

    • 著者名/発表者名
      Daisuke Ikeda
    • 学会等名
      the 2013 International Conference on Parallel and Distributed Processing Techniques and Applications
    • 発表場所
      ラスベガス
    • 関連する報告書
      2013 実績報告書
  • [学会発表] Mining Pure Patterns in Texts2012

    • 著者名/発表者名
      山田泰寛
    • 学会等名
      2012 IIAI International Conference on Advanced Applied Informatics
    • 発表場所
      福岡
    • 年月日
      2012-09-21
    • 関連する報告書
      2012 実績報告書

URL: 

公開日: 2012-04-24   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi