2006 Fiscal Year Annual Research Report

大規模ゲノムデータ処理に対する高速高精度アルゴリズムの開発

Research Project

Project/Area Number	18017015
Research Institution	Nagoya University
Principal Investigator	柳浦睦憲名古屋大学, 情報科学研究科, 助教授 (10263120)
Co-Investigator(Kenkyū-buntansha)	宇野毅明国立情報学研究所, 情報学基礎研究系, 助教授 (00302977) 小野廣隆九州大学, 大学院システム情報科学研究院, 助手 (00346826)
Keywords	ゲノム情報 / 高度な検索・比較 / データマイニング / 列挙アルゴリズム / 確率的解析 / 頻出集合
Research Abstract	ゲノム研究に関わるデータは巨大なものが多い.全体的な特徴の観察や,類似する項目の発見・グループ分け(類似検索・クラスタリング),確からしいルール・特徴ある部分構造の発見(ルール/データマイニング)を行うことは,ゲノム研究において非常に重要な位置を占める.しかし,データが巨大であるため,従来の素朴な方法では計算に莫大な時間がかかる.全ての項目を総当りで比較するのではなく,効率良く類似する可能性のあるペアだけを絞り込むことができれば,極めて短時間で計算を終了することが可能である.本年度は,ゲノム情報学で基礎的な問題の中から,実験結果の解析に使われるパターンマイニング,最適分類規則発見,配列の決定やアセンブリなどで用いられる相同性の発見アルゴリズムと並び替えを行うアルゴリズムの開発に関して,最適化・アルゴリズム的な技術を適用して改善できる点を見つけ出し,そこに新たな技法を提案した.代表的な成果を以下に挙げる. -比較ゲノム分野でも多くの応用を持つ集合被覆問題に対する実用的なアルゴリズムを開発した.提案手法では,ラグランジュ緩和に基づく工夫などを取り入れることにより大規模な問題にも適用可能となった. -与えられたグラフから,擬似クリーク,インターバルグラフなどのクラスに属するグラフ全て見つけ出すアルゴリズムを開発した.効率良い列挙するアルゴリズムを設計し,実データでも高速に動く実装を作成した. -昨年度開発した文字列データの中から頻出する極大モチーフを全て発見する効率良いアルゴリズムを改良し,意味的に重要であると思われるパターンのみを抽出することに成功した. -大量の,各項目が同じ長さの短い文字列からなるデータベースの中から類似するものの組を全て見つける高速アルゴリズムの改良を行った. -DNAデータ解析において用いられる大きな規模の塩基配列集合設計を生成するアルゴリズムを開発した.

Research Products
(6 results)

All 2007 2006

All Journal Article (6 results)

[Journal Article] An Efficient Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2007
- Author(s)
  H.Arimura, T.Uno
- Journal Title
  
  Journal of Combinatorial Optimization 13
  
  Pages: 243-262
[Journal Article] A 3-Flip Neighborhood Local Search for the Set Covering Problem2006
- Author(s)
  M.Yagiura, M.Kishida, T.Ibaraki
- Journal Title
  
  European Journal of Operational Research 172
  
  Pages: 472-499
[Journal Article] A Randomness Based Analysis on the Data Size Needed for Generating Reliable Rules2006
- Author(s)
  K.Haraguchi, M.Yagiura
- Journal Title
  
  Proc. of the 2nd Int. Conf. on Knowledge Eng. and Decision Support (ICKEDS 2006)
  
  Pages: 75-82
[Journal Article] Enumerating Minimal Explanations by Minimal Hitting Set Computation2006
- Author(s)
  K.Satoh, T.Uno
- Journal Title
  
  KSEM 2006, Lecture Notes in Computer Science 4092
  
  Pages: 354-365
[Journal Article] Listing Chordal Graphs and Interval Graphs2006
- Author(s)
  M.Kiyomi, S.Kijima, T.Uno
- Journal Title
  
  WG 2006, Lecture Notes in Computer Science 4271
  
  Pages: 68-77
[Journal Article] DNA Sequence Design by Dynamic Neighborhood Searches2006
- Author(s)
  S.Kawashimo, H.Ono, K.Sadakane, M.Yamashita
- Journal Title
  
  DNA 2006, Lecture Notes in Computer Science 4278
  
  Pages: 157-171

2006 Fiscal Year Annual Research Report

大規模ゲノムデータ処理に対する高速高精度アルゴリズムの開発

Principal Investigator

柳浦 睦憲 名古屋大学, 情報科学研究科, 助教授 (10263120)

Research Products

[Journal Article] An Efficient Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2007

Author(s)

Journal Title

[Journal Article] A 3-Flip Neighborhood Local Search for the Set Covering Problem2006

Author(s)

Journal Title

[Journal Article] A Randomness Based Analysis on the Data Size Needed for Generating Reliable Rules2006

Author(s)

Journal Title

[Journal Article] Enumerating Minimal Explanations by Minimal Hitting Set Computation2006

Author(s)

Journal Title

[Journal Article] Listing Chordal Graphs and Interval Graphs2006

Author(s)

Journal Title

[Journal Article] DNA Sequence Design by Dynamic Neighborhood Searches2006

Author(s)

Journal Title

柳浦睦憲名古屋大学, 情報科学研究科, 助教授 (10263120)