研究課題/領域番号 |
25280079
|
研究種目 |
基盤研究(B)
|
配分区分 | 一部基金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 北海道大学 |
研究代表者 |
中村 篤祥 北海道大学, 情報科学研究科, 准教授 (50344487)
|
研究分担者 |
工藤 峰一 北海道大学, 大学院情報科学研究科, 教授 (60205101)
瀧川 一学 北海道大学, 大学院情報科学研究科, 准教授 (10374597)
|
連携研究者 |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
喜田 拓也 北海道大学, 大学院情報科学研究科, 准教授 (70343316)
大久保 好章 北海道大学, 大学院情報科学研究科, 助教 (40271639)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 知識発見とデータマイニング / シーケンスマイニング / ゲノム情報処理 / 頻出パターンマイニング |
研究成果の概要 |
DNAなどの巨大シーケンス内に存在する散在反復配列を抽出する方法として,頻出近似文字列パターンを列挙するアルゴリズムを開発し,列挙されたパターンの出現領域を抽出する方式を考案した.提案手法のパターンは出現領域の境界がはっきりしているため,同じ領域を重ねて数えることが少ない.また,提案列挙アルゴリズムは高速かつ省メモリーで動作する.ヒトゲノムの21番染色体に適用したところ,著名な散在反復配列であるAlu配列の出現領域とされる領域の約50%を,100個の代表パターンの出現領域として抽出することに成功した.
|
自由記述の分野 |
知能情報学
|