2012 Fiscal Year Research-status Report
Project/Area Number |
24700130
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Kobe University |
Principal Investigator |
斎藤 寿樹 神戸大学, 工学(系)研究科(研究院), 助教 (00590390)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | アルゴリズム / 区間データ / バイオインフォマティクス / ZDD |
Research Abstract |
区間グラフは区間表現と呼ばれる区間の集合を持つグラフである.グラフの各頂点は区間表現の区間と対応し,頂点間に辺がある必要十分条件が,対応する区間に重なりがあるときである.本研究では,区間グラフおよび区間表現に対する効率のよいアルゴリズムの開発を行っている. 区間グラフの認識問題はグラフが与えられたとき,そのグラフが区間グラフかどうかを判定する問題で,古くから研究が行われ,高速なアルゴリズムがいくつも知られている.この問題を拡張した問題として区間グラフの部分表現拡張問題がある.区間グラフの部分表現問題は区間グラフとその区間グラフの区間表現の一部が与えられたとき,その区間表現を拡張して,与えられた区間グラフの区間表現を構築する問題である.この問題に対する多項式時間アルゴリズムが知られていたが,本研究ではより高速なアルゴリズムの開発に成功した.また,この問題に対し,各区間が離散的であるときについても考え,いくつかのバリエーションについて,計算困難性の証明や高速なアルゴリズムを与えることに成功した.これらのアルゴリズムは区間表現の各区間をDNAの断片や時間と見なすことで,バイオインフォマティクスやスケジューリングへの応用が期待される.また,本研究は国際会議ISAAC2012に採択された. また,バイオインフォマティクスへの応用として,ZDD(Zero-suppressed Binary Decision Diagram)を用いた有向二値完全系統樹を列挙する高速なアルゴリズムの開発に成功した.ZDDとは組合せ集合を表現するデータ構造で膨大な数の解を効率よく表現することができる.本成果は国際会議SEA2012に採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
近年,ビッグデータの活用が重要視されており,そうしたビッグデータの中にはDNAの塩基配列やタイムインターバルのデータとして,巨大な区間データがある.本研究の目標は,巨大な区間データに対する効率のよい処理系の開発である. これまでの研究では,区間データに対し,区間グラフを用いて高速に処理するアルゴリズムの開発を行っている.具体的には,区間グラフおよび区間表現を用いた区間グラフの部分表現拡張問題への効率のよいアルゴリズムの開発に成功した.このアルゴリズムは区間グラフの認識問題を拡張した問題であり,多くの応用への適用が期待される.しかし,開発したアルゴリズムのメモリスペースや時間といった計算量を考慮すると,まだ膨大なサイズの区間データに対するアルゴリズムとは言えない. 一方で,巨大データを効率よく表現するデータ構造としてZDDがある.有向二値完全系統樹を列挙する問題に対し,このZDDを用いた高速なアルゴリズムを開発し,ZDDの有用性を示すことができた.ZDDには豊富な演算体系が用意されており,これらの演算体系を用いることにより,ZDDで表現された組合せ集合から特徴抽出を容易に行うことができる.しかし,ZDDは区間データを表現するには構造が単純であるため,より区間データに特化したデータ構造の開発が必要となる. 以上のことから,現時点において,区間データを処理するための効率のよいアルゴリズムの開発およびデータ構造ZDDの有用性を示すことができている.しかし,まだ大規模な区間データを処理するためのアルゴリズムおよびデータ構造の開発が進んでいない.本研究では,これらのアルゴリズムおよびデータ構造を拡張し,区間データを表現するアルゴリズムおよびデータ構造により,効率よく巨大な区間データを表現することを目指す.
|
Strategy for Future Research Activity |
区間データに対する特徴抽出のためのデータ構造およびアルゴリズムの開発を行うために,まず,区間データを効率的に表現することができる区間グラフの列挙が喫緊の課題である.現在では,一つ当たり多項式時間による列挙アルゴリズムは開発できている.しかし,膨大な区間データに対しては線形時間もしくは定数時間のアルゴリズムが必要である.膨大な区間データを扱うために,区間グラフの高速な列挙手法の提案を行う. 次に,上記のアルゴリズムにより列挙したデータを効率よく表現するためのデータ構造が必要となる.これはZDDなどのデータ構造を拡張したもので,単に区間データを効率よく表現するだけでなく,区間データを処理ための処理系の開発も同時に行う.これらのアルゴリズムにより,区間データから高速に特徴を抽出する手法の提案を目指す.また,近年Knuthによるフロンティア法と呼ばれるZDDを用いた高速な列挙手法が提案されており,こうした新たな列挙手法の活用も視野に入れ,研究を進めていく.
|
Expenditure Plans for the Next FY Research Funding |
ZDDを用いたアルゴリズムを実行するためには,膨大なメモリ空間を必要とする.そのため,メモリ容量の大きい計算サーバの購入を行う.また,国内外の研究者と研究議論を行うとともに,国内研究会および国際会議にて研究発表を行うための旅費として使用する.
|
Research Products
(6 results)