Project/Area Number |
23K10975
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60010:Theory of informatics-related
|
Research Institution | Tohoku University |
Principal Investigator |
酒井 義文 東北大学, 農学研究科, 准教授 (10277361)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2025: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2024: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2023: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
|
Keywords | アルゴリズム / 列挙 / 文字列 / 極大共通部分列 / 数値列 / 最大和断片 / 共通部分列 |
Outline of Research at the Start |
文字列同士の比較は、研究や産業の分野を問わず様々な応用において現れる。互いに関係性の存在が想定されるような複数本の文字列において、各々のどの文字が対応し合うのかを求める多重アラインメント問題は、分子生物学においてモデル生物同士や近縁種同士の塩基配列やアミノ酸配列における類似構造を解析する際に重要な役割を果たす。多重アラインメントを求める一つのアプローチは、すべての文字に共通する非自明な部分列をガイドとして用いることである。本研究では、任意の本数の文字列に対して、非自明かつ有用な共通部分列の候補として極大共通部分列を考え、これを多項式時間遅延で列挙するアルゴリズムの開発を試みる。
|
Outline of Annual Research Achievements |
多重文字列の極大共通部分列を効率よく列挙するためのアルゴリズムの設計を目指す一環として、系列データを効率よく処理するための線形領域アルゴリズムに採用し得る手法の開発を意図し、以下の成果を得た。 (1)2本の文字列の極大共通部分列を列挙するアルゴリズムとして、2乗領域を用いて動作する既存のアルゴリズムを、従来用いられていたデータ構造が常時保持するデータを必要なもののみに限定するように変更することで、線形領域で動作するアルゴリズムへと改良した。また、線形領域ではなく3乗領域を要するものの、既存のアルゴリズムとは異なるアプローチを採用することで、すべての極大共通部分列を効率よく表現する新規に提案したデータ構造を用いるアルゴリズムを設計した。後者のアルゴリズムは、条件の課された特別な極大共通部分列を効率よく探索することにも利用できる。残念ながら、どちらのアルゴリズムに用いられた手法も、多重文字列の極大共通部分列の列挙をするためにそのまま適用すると、文字列の本数に関する指数関数的な大きさの領域を要する。 (2)任意に指定されるオフセットを伴う数値列における最大和断片を効率よく求めるためのデータ構造を提案し、これを効率よく構築する線形領域アルゴリズムを設計した。ここで、オフセットを伴う数値列とは、数値列の各要素の値からオフセットとして指定された値を減ずることで結果として得られる数値列のことである。文字列の極大共通部分列と数値列の最大和断片は異なる計算対象であるが、線形領域を実現するために採用した手法は、多重文字列の極大共通部分列の列挙において用いる領域の大きさを指数関数ではなく多項式に抑えるための手法の開発の一助となる可能性がある。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究課題において、当初より、2つのアプローチにより多重文字列に対する極大共通部分列を列挙するアルゴリズムの設計を目指すことが計画されていた。一つは、2本の文字列に対する極大共通部分列を線形領域で列挙するアルゴリズムの設計であり、もう一つは、多重文字列に対するすべての共通部分列への適切な順序づけである。このうち、前者のアプローチについては、線形領域アルゴリズムを設計することができたものの、得られた手法をそのまま多重文字列へと適用したとしても多項式領域での極大共通部分列列挙は実現できない。このため、得られた手法とは異なる別の手法の開発を目指す必要がある。後者のアプローチについては、現時点で成果につながる足がかりを未だ得ていない状況である。
|
Strategy for Future Research Activity |
多重文字列の極大共通部分列を効率よく列挙するアルゴリズムの設計を目指して、2本の文字列に対する極大共通部分列を線形領域で列挙する新たな手法に基づくアルゴリズムの設計と、多重文字列のすべての極大共通部分列に対する適切な順序づけを設計することを予定している。また、2本の文字列に対する最長共通部分列の列挙などの関連する問題を効率的に解くためのアルゴリズムの設計を通して、利用可能な手法の模索にも取り組む。
|
Report
(1 results)
Research Products
(2 results)