• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文字列属性を含む多属性データからのパターン発見アルゴリズムに関する研究

研究課題

研究課題/領域番号 15700121
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関東京大学

研究代表者

坂内 英夫  東京大学, 医科学研究所, 助手 (20323644)

研究期間 (年度) 2003 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
3,200千円 (直接経費: 3,200千円)
2004年度: 1,500千円 (直接経費: 1,500千円)
2003年度: 1,700千円 (直接経費: 1,700千円)
キーワードパターン発見 / 接尾辞木 / 接尾辞配列 / 索引構造 / suffix tree
研究概要

本年度は前年度に扱った,文字列属性中の出現が実数値属性との相関が高い様なパターンを発見する,相関パターン発見問題を更に発展させた.主な成果は以下の通りである.
●2つの部分文字列パターンの論理的組み合わせを探索するアルゴリズムについて:接尾辞木(Suffix Tree)と言うデータ構造を用いる事で,最適なパターンの組をデータ中の文字列の長さの総和をNとした時にO(N^2)時間で求める事ができる新しいアルゴリズムを示した.更にアルゴリズムを一般化し,k個のパターンの最適な組み合わせがO(N^k)時間で求められる事を示した.また,接尾辞配列(Suffix Array)と言うデータ構造を用いた同アルゴリズムの効率の良い実装を示した.
●2つの部分文字列パターンの論理的組み合わせに関して,更に出現位置に関する制約を加えた場合にもO(N^2)時間で最適なものを求める事ができるアルゴリズムを示した.
●アルゴリズムを酵母及びヒトのマイクロアレイ実験によって得られたmRNAの分解速度(半減期)を測定した数値データと,mRNAの分解に関係すると言われている3'UTR配列を組にしたデータに対して適用した.得られたパターンはmRNAの分解に関係すると言われる蛋白が結合する配列を一部含んでおり,アルゴリズムの有用性を示す事ができた.

報告書

(2件)
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (7件)

すべて 2004 その他

すべて 雑誌論文 (4件) 文献書誌 (3件)

  • [雑誌論文] An O(N^2) Algorithm for Discovering Optimal Boolean Pattern Pairs2004

    • 著者名/発表者名
      Hideo Bannai et al.
    • 雑誌名

      IEEE/ACM Trans.Comp.Biol.Bioinfo. 1・4

      ページ: 159-170

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Optimal Pairs of Cooperative and Competing Patterns with Bounded Distance2004

    • 著者名/発表者名
      Shunsuke Inenaga et al.
    • 雑誌名

      Lecture Notes in Computer Science (Discovery Science (DS2004)) 3245

      ページ: 32-46

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Optimal Pairs of Patterns2004

    • 著者名/発表者名
      Hideo Bannai et al.
    • 雑誌名

      Lecture Notes in Bioinformatics (WABI2004) 3240

      ページ: 450-462

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Efficiency Finding Regulatory Elements using correlation with Gene Expression2004

    • 著者名/発表者名
      Hideo Bannai et al.
    • 雑誌名

      Journal of Bioinformatics and Computational Biology 2・2

      ページ: 273-288

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] Hideo Bannai, et al.: "Efficiently finding regulatory elements using correlation with gene expression"Journal of Bioinformatics and Computational Biology. in press.

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Masayuki Takeda et al.: "Discovering most classificatory patterns for very expressive pattern classes"Lecture Notes in Computer Science (Discovery Science (DS2003)). 2843. 486-493 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hideo Bannai, et al.: "Inferring strings from graphs and arrays"Lecture Notes in Computer Science (Mathematical Foundations of Computer Science (MFCS 2003)). 2747. 208-217 (2003)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi