大規模ゲノムデータ処理に対する高速高精度アルゴリズムの開発

Research Project

Project/Area Number	18017015
Research Category	Grant-in-Aid for Scientific Research on Priority Areas
Allocation Type	Single-year Grants
Review Section	Biological Sciences
Research Institution	Nagoya University
Principal Investigator	柳浦睦憲 Nagoya University, 情報科学研究科, 准教授 (10263120)
Co-Investigator(Kenkyū-buntansha)	宇野毅明国立情報学研究所, 情報学プリンシプル研究系, 准教授 (00302977) 小野廣隆九州大学, 大学院・システム情報科学研究院, 助教 (00346826)
Project Period (FY)	2006 – 2007
Project Status	Completed (Fiscal Year 2007)
Budget Amount *help	¥8,600,000 (Direct Cost: ¥8,600,000) Fiscal Year 2007: ¥4,200,000 (Direct Cost: ¥4,200,000) Fiscal Year 2006: ¥4,400,000 (Direct Cost: ¥4,400,000)
Keywords	ゲノム情報 / 高度な検索・比較 / データマイニング / 列挙アルゴリズム / 確率的解析 / 頻出集合
Research Abstract	ゲノム研究に関わるデータは巨大なものが多い.全体的な特徴の観察や,類似する項目の発見・グループ分け(類似検索・クラスタリング),確からしいルール・特徴ある部分構造の発見(ルール/データマイニング)を行うことは,ゲノム研究において非常に重要な位置を占める.しかし,データが巨大であるため,従来の素朴な方法では計算に莫大な時間がかかる.全ての項目を総当りで比較するのではなく,効率良く類似する可能性のあるペアだけを絞り込むことができれば,極めて短時間で計算を終了することが可能である.本年度は,ゲノム情報学で基礎的な問題の中から,実験結果の解析に使われるパターンマイニング,最適分類規則発見,配列の決定やアセンブリなどで用いられる相同性の発見アルゴリズムと並び替えを行うアルゴリズムの開発に関して,最適化・アルゴリズム的な技術を適用して改善できる点を見つけ出し,そこに新たな技法を提案した.代表的な成果を以下に挙げる. ・与えられたグラフから,クリークに近い構造を全て見つける問題,データベースから多くの項目にあいまいさを許容した意味で含まれる集合を全て見つけ出す問題に対するアルゴリズムを開発した. ・ベクトル集合の各要素に真か偽が与えられているデータ集合に対するパターン抽出の基本問題に関する性質を解析した. ・集合被覆問題に対する高速近似解法を設計する上で有効な手法を検討し,知見を得た. ・DNA解析等で利用される,所定の熱力学的制約を満たしたDNA配列集合を自動的に生成(設計)するアルゴリズムを提案した.

Report

(2 results)

2007 Annual Research Report
2006 Annual Research Report

Research Products
(12 results)

All 2008 2007 2006

All Journal Article (12 results) (of which Peer Reviewed: 6 results)

[Journal Article] An Efficient Algorithm for Finding Similar Short Substrings from Large Scale String Data2008
- Author(s)
  Uno, T.
- Journal Title
  
  The Pacific-Asia Conference on Knowledge Discovery and Data Mining
- Related Report
  2007 Annual Research Report
- Peer Reviewed
[Journal Article] A Randomness Based Analysis on the Data Size Needed for Removing Deceptive Patterns2008
- Author(s)
  Haraguchi, K., Yagiura, M., Boros, E., and Ibaraki, T.
- Journal Title
  
  IEICE Transactions on Information and Systems E91-D
  
  Pages: 781-788
- NAID
  10026802223
- Related Report
  2007 Annual Research Report
- Peer Reviewed
[Journal Article] Efficient Polynomial Delay Algorithm fbr Pseudo Frequent Itemset Mining2007
- Author(s)
  Uno, T., and Arimura, H.
- Journal Title
  
  Lecture Notes in Artificial Intelligence 4755
  
  Pages: 219-230
- Related Report
  2007 Annual Research Report
- Peer Reviewed
[Journal Article] Mining complex genotypic features for predicting HIV-1 drug resistance2007
- Author(s)
  Saigo, H., Uno, T., and Tsuda, K.
- Journal Title
  
  Bioinformatics 23
  
  Pages: 2455-2462
- Related Report
  2007 Annual Research Report
- Peer Reviewed
[Journal Article] Relaxation Heuristics for the Set Covering Problem2007
- Author(s)
  Umetani, S., and Yagiura, M.
- Journal Title
  
  Journal of the Operations Research Society of Japan 50
  
  Pages: 350-375
- NAID
  120001309817
- Related Report
  2007 Annual Research Report
- Peer Reviewed
[Journal Article] Neighborhood Searches for Thermodynamically Designing DNA Sequence2007
- Author(s)
  Kawashimo, S., Ono, H., Sadakane. K., and Yamashita, M.
- Journal Title
  
  Preliminary Proceedings of the 13th International Meeting on DNA Computing, Memphis
  
  Pages: 211-220
- Related Report
  2007 Annual Research Report
- Peer Reviewed
[Journal Article] An Efficient Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2007
- Author(s)
  H.Arimura, T.Uno
- Journal Title
  
  Journal of Combinatorial Optimization 13
  
  Pages: 243-262
- Related Report
  2006 Annual Research Report
[Journal Article] A 3-Flip Neighborhood Local Search for the Set Covering Problem2006
- Author(s)
  M.Yagiura, M.Kishida, T.Ibaraki
- Journal Title
  
  European Journal of Operational Research 172
  
  Pages: 472-499
- Related Report
  2006 Annual Research Report
[Journal Article] A Randomness Based Analysis on the Data Size Needed for Generating Reliable Rules2006
- Author(s)
  K.Haraguchi, M.Yagiura
- Journal Title
  
  Proc. of the 2nd Int. Conf. on Knowledge Eng. and Decision Support (ICKEDS 2006)
  
  Pages: 75-82
- NAID
  110004851555
- Related Report
  2006 Annual Research Report
[Journal Article] Enumerating Minimal Explanations by Minimal Hitting Set Computation2006
- Author(s)
  K.Satoh, T.Uno
- Journal Title
  
  KSEM 2006, Lecture Notes in Computer Science 4092
  
  Pages: 354-365
- Related Report
  2006 Annual Research Report
[Journal Article] Listing Chordal Graphs and Interval Graphs2006
- Author(s)
  M.Kiyomi, S.Kijima, T.Uno
- Journal Title
  
  WG 2006, Lecture Notes in Computer Science 4271
  
  Pages: 68-77
- Related Report
  2006 Annual Research Report
[Journal Article] DNA Sequence Design by Dynamic Neighborhood Searches2006
- Author(s)
  S.Kawashimo, H.Ono, K.Sadakane, M.Yamashita
- Journal Title
  
  DNA 2006, Lecture Notes in Computer Science 4278
  
  Pages: 157-171
- NAID
  110004741455
- Related Report
  2006 Annual Research Report

大規模ゲノムデータ処理に対する高速高精度アルゴリズムの開発

Principal Investigator

柳浦 睦憲 Nagoya University, 情報科学研究科, 准教授 (10263120)

¥8,600,000 (Direct Cost: ¥8,600,000)

Report

Research Products

[Journal Article] An Efficient Algorithm for Finding Similar Short Substrings from Large Scale String Data2008

Author(s)

Journal Title

Related Report

[Journal Article] A Randomness Based Analysis on the Data Size Needed for Removing Deceptive Patterns2008

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Efficient Polynomial Delay Algorithm fbr Pseudo Frequent Itemset Mining2007

Author(s)

Journal Title

Related Report

[Journal Article] Mining complex genotypic features for predicting HIV-1 drug resistance2007

Author(s)

Journal Title

Related Report

[Journal Article] Relaxation Heuristics for the Set Covering Problem2007

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Neighborhood Searches for Thermodynamically Designing DNA Sequence2007

Author(s)

Journal Title

Related Report

[Journal Article] An Efficient Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2007

Author(s)

Journal Title

Related Report

[Journal Article] A 3-Flip Neighborhood Local Search for the Set Covering Problem2006

Author(s)

Journal Title

Related Report

[Journal Article] A Randomness Based Analysis on the Data Size Needed for Generating Reliable Rules2006

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Enumerating Minimal Explanations by Minimal Hitting Set Computation2006

Author(s)

Journal Title

Related Report

[Journal Article] Listing Chordal Graphs and Interval Graphs2006

Author(s)

Journal Title

Related Report

[Journal Article] DNA Sequence Design by Dynamic Neighborhood Searches2006

Author(s)

Journal Title

NAID

Related Report

柳浦睦憲 Nagoya University, 情報科学研究科, 准教授 (10263120)