2008 Fiscal Year Annual Research Report
効率的な極大極小元列挙アルゴリズムのための新しい理論構築とその実用化
Project/Area Number |
19700017
|
Research Institution | National Institute of Informatics |
Principal Investigator |
宇野 毅明 National Institute of Informatics, 情報学プリンシプル研究系, 准教授 (00302977)
|
Keywords | 極大元 / 列挙 / アルゴリズム / 双対化 / 極小集合被覆 / マトロイド / 出力多項式時間 |
Research Abstract |
コーダルグラフとは、長さ4以上のサイクルが必ずショートカットを持つグラフのことを言う。本年度の研究では、コーダルグラフに含まれる部分コーダルグラフの列挙問題に対して、指定した枝を含み、他の指定された枝を含まないようなもののみを列挙するアルゴリズムについて研究を行ない、遅延が多項式時間であるアルゴリズムを開発した。また、同時に同問題の数え上げが困難であることも証明した。コーダルグラフから極大なクリークを逐次的に取り除いて得られるクリークの列を完全列という。完全列はクリークを除去する列の中で極大なものである。本年度の研究では、完全列をグラフ的に特徴付けることにより効率的な列挙手法を開発し、遅延が0(1)である、つまり計算量的には最適であるアルゴリズムを開発した。 また、データマイニングの問題で、巨大な文字列から類似する部分文字列の組を全て見つけ出す問題に対して、効率的なアルゴリズムを開発した。また、連続的ハミング距離というあたらしい距離を導入し、この距離のもとでは極大な類似文字列が単純な形で定義され、かつ前述のアルゴリズムに、速度を大きく損なうことない改良を加えることで列挙できることを示した。また、グラフに含まれる密部分グラフ、アイテム集合データベースの多くの項目にある程度のあいまいさを許した上で含まれるようなアイテム集合(あいまい頻出集合)を列挙するアルゴリズムを開発した。両者共に逆探索という列挙手法を用いることで、1つあたり多項式時間での列挙を達成した。このアルゴリズムを用いて、極大な密部分グラフ、極大なあいまいな頻出集合を短時間で列挙することも可能である。
|