2014 Fiscal Year Annual Research Report
Project/Area Number |
25280079
|
Research Institution | Hokkaido University |
Principal Investigator |
中村 篤祥 北海道大学, 情報科学研究科, 准教授 (50344487)
|
Co-Investigator(Kenkyū-buntansha) |
瀧川 一学 北海道大学, 情報科学研究科, 准教授 (10374597)
工藤 峰一 北海道大学, 情報科学研究科, 教授 (60205101)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 知識発見とデータマイニング |
Outline of Annual Research Achievements |
巨大シーケンスからすべての散在反復配列の近似パターンを高速に抽出する方式の開発を目指して研究を進めている。 昨年度までにギャップ数制約付き頻出近似パターン抽出法の提案を行い、人工データでその有効性を確認した他、ヒトゲノムの第21染色体にギャップ2以下の制約付きでアルゴリズムを適用し、長さが300くらいの散在反復配列であるSINEの代表的な配列であるAluファミリーに属する配列の50%が自動抽出できることを確認した。 今年度は、提案手法の実用性を実証するためにヒトの全染色体およびナズナ・酵母菌・線虫・ゼブラフィッシュ・フグ・ショウジョウバエ・鶏・ハツカネズミ・ドブネズミの全染色体に適用し、出現領域長合計が全体の0.1%以上で長さが100以上の反復配列を抽出した。抽出した頻出パターンには類似なものが多く存在するため、頻度とオカレンスの概念を用いて疑似クローズドという概念を導入し、より重要なパターンのみ選ぶ方法を開発した。このように重要なもののみ抽出できたとしても、類似なものはある程度抽出されるがそれらの関係の分析法についても検討を行った。抽出された反復パターン配列を頂点とし、類似性に基づいて重み付けされた辺をもつグラフから重要なパスを抽出することによりパターン配列間の関係を推定する方法を考案した。ヒトゲノムの既知反復配列であるAluファミリーにて、提案法の有効性について検証実験を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
散在反復文字列パターン抽出法の開発、およびDNA配列における散在反復配列の抽出の2項目に関しては予定通り進行しているが、実験に予想以上の時間がかかってしまったため、楽曲の繰り返し構造分析法の開発を行う時間が十分にとれなかった。
|
Strategy for Future Research Activity |
散在反復文字列パターン抽出法の開発、およびDNAにおける散在反復配列の抽出の2項目に関しては計画通り、アルゴリズムの高速化・省メモリ化を進めると共に、DNAに適用して新しい分析法を開発し、進化の過程における新しい発見をを目指す。楽曲の繰り返し構造分析法の開発に関しては、転調・移調や多重シーケンスに対応した方式の開発を連携研究者と協力して進める。
|
Causes of Carryover |
購入した英語の本が予想以上に安価であったため。
|
Expenditure Plan for Carryover Budget |
関連研究調査のための本を購入する。
|
Research Products
(4 results)
-
[Journal Article] MED26 regulates the transcription of snRNA genes through the recruitment of little elongation complex2015
Author(s)
Hidehisa Takahashi, Ichigaku Takigawa, Masashi Watanabe, Delnur Anwar, Mio Shibata, Chieri Tomomori-Sato, Shigeo Sato, Amol Ranjan, Chris W. Seidel, Tadasuke Tsukiyama, Wataru Mizushima, Masayasu Hayashi, Yasuyuki Ohkawa, Joan W. Conaway, Ronald C. Conaway, Shigetsugu Hatakeyama
-
Journal Title
Nature Communications
Volume: 6
Pages: 5941
DOI
Peer Reviewed / Acknowledgement Compliant
-
-
-