研究課題/領域番号 |
24500023
|
研究種目 |
基盤研究(C)
|
研究機関 | 東京電機大学 |
研究代表者 |
陳 致中 東京電機大学, 理工学部, 教授 (00242933)
|
研究期間 (年度) |
2012-04-01 – 2017-03-31
|
キーワード | Closest文字列問題 / 共有中心列問題 / 網状ネットワーク問題 / 固有パラメータアルゴリズム / NP困難性 / バイオインフォマティクス |
研究概要 |
まず、中心列問題を解く新しいアルゴリズムを設計した。この問題で、n本の同じ長さLの文字列 および 負でない整数dが与えられ、各文字列とのハミング距離がd以下であるような文字列(中心列という)が存在するかを判定したい。この問題は計算生物学において極めて重要で、以前たくさんの(厳密または近似)アルゴリズムが設計された。以前の厳密アルゴリズムはすべて「2-stringアプローチ」に基づいている。本研究で、「3-stringアプローチ」という斬新な手法でこの問題を解いた。結果の厳密アルゴリズムはアルファベットが小さいとき、以前のアルゴリズムより高速である。 次に、共有中心列問題を解く新しいアルゴリズムを設計した。この問題はある遺伝病を引き起こす遺伝子の特定に密接に関係しているため、極めて重要である。この問題がNP困難であること、および、それを解く近似率2の近似アルゴリズムが存在することが以前知られていた。本研究で、この問題を解く厳密アルゴリズムを設計して、それが漸近的に最適であることを証明した。また、新しいアルゴリズムを実装して、国際HapMapプロジェクトで得られた実際のデータを用いてその性能を計測した。その結果、新しいアルゴリズムが以前の近似アルゴリズムよりも遺伝子の突然変異領域の探知に有効であることを確認できた。 さらに、網状ネットワーク問題を解く新しいアルゴリズムを設計して実装した。この新しいアルゴリズムは分枝限定法に基づいている。その主なアイディアは、rSPR距離問題の厳密アルゴリズムを探索木の枝刈りに利用した所にある。実際のデータに対して本研究で得たプログラムの性能を計測した結果、その速度が以前のソフトウエア(HybridNetやDendroscope3)よりはるかに速いことが分かった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
予想以上の結果が得られて、学術論文5編にまとめて発表することができた。
|
今後の研究の推進方策 |
まず、計算困難な網状ネットワーク問題のより高速な厳密アルゴリズムを設計して実装し、その性能を測定したい。 次に、計算困難なハプロタイプ組立問題に取り組みたい。この問題はバイオインフォマティクスにおいてきわめて重要で、近年盛んに研究されてきた。しかし、これまでのアルゴリズムは最適な解を出力できないかまたはPCクラスタ上でも長い時間を必要とした。本研究では、1台のPC上でも高速に最適な解を出力できるような厳密アルゴリズムを設計して実装し、その性能を測定したい。 さらに、計算困難なClosest文字列問題のrandomized厳密アルゴリズムを設計して実装し、その性能を測定したい。この問題に対する今までの厳密アルゴリズムはすべてrandomizedではなかった。本研究で、randomnessを使うことによって、より高速な厳密アルゴリズムを設計できるか試みる。
|
次年度の研究費の使用計画 |
本研究では、低予算で高性能のソフトウエアを作ることを目指している。したがって、高価な設備を購入する予定がまったくない。一方、よいソフトウエアを作るにはアイディアが必要で、アイディアを生み出すには外部との交流が不可欠である。ゆえに、研究費をほとんど旅費に使う予定である。
|