Development of Algorithms for Ultrametric Tree Optimization and Hierarchical Clustering Optimization
Project/Area Number |
22K11921
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60020:Mathematical informatics-related
|
Research Institution | Shizuoka University |
Principal Investigator |
安藤 和敏 静岡大学, 工学部, 教授 (00312819)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
|
Keywords | 組合せ最適化 / クラスタリング / 系統樹 / デンドログラム / 超距離 / アルゴリズム / クラスター解析 / バイオインフォマティクス / 系統学 |
Outline of Research at the Start |
超距離木は最も基本的な系統樹のモデルである.最良近似超距離木問題とは,対象とする生物種間の相違を表す行列を最も良く近似する超距離木を求める問題である.本研究では,最良近似超距離木問題及びそれに類似する問題に対する高速な局所探索アルゴリズムを開発する.また,階層クラスタリングによって生成されるクラスタの階層は超距離木と同値な概念であるデンドログラムと呼ばれる図式によって表現される.本研究では,超距離木最適化問題に対する局所探索アルゴリズムを階層クラスタリング最適化問題に応用する.本研究ではさらに,階層クラスタリング最適化問題に対する局所探索アルゴリズムを重複階層クラスタリング最適化へと拡張する.
|
Outline of Annual Research Achievements |
2022年度は,研究計画調書に記載した3つの研究計画のうち,「(2)階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」に関連する研究を行った.階層クラスタリングとは, 与えられたデータ集合を,類似するデータから成るクラスターへの分割の階層構造を求める手続きである.階層構造はクラスター木(あるいは,デンドログラム)と呼ばれる2分木によって表現される.Dasgupta (2016) はクラスター木に対する目的関数を導入し,階層クラスタリングの問題を組合せ最適化問題として定式化した.Dasgupta はこの問題がNP困難であることを示すと同時に,この問題に対して再帰的最疎カットアルゴリズムと呼ばれるO(φ)-近似アルゴリズムを与えた. 本研究では, Dasgupta (2016) の目的関数を最小化するクラスター木を見出す問題に対して, kSS操作 (k制限部分木交換操作)と呼ばれる2分木の変形操作に基づく局所探索アルゴリズムを提案し,このアルゴリズムの1反復あたりの計算時間がO(n min{2k+1,n}k)であることを示した. ここで, 1≦ k ≦ nである. さらに開発したアルゴリズムの実際的性能を数値実験によって評価した. Cohen-Addad et al. (2019) は,Dasgupta (2016) の目的関数を一般化して,許容的目的関数と呼ばれる階層クラスタリングに対する目的関数のクラスを定義した.許容的目的関数の定義は抽象的なものであり具体的な関数の形は与えられていなかったが,本研究では,3次以下の多項式を用いて定義される許容的目的関数に対する特徴付けを与えた.さらに, 再帰的最疎カットアルゴリズムはこのような許容的目的関数を最小化するクラスター木を求める問題に対するO(φ)-近似アルゴリズムであることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
【研究実績の概要】に記載した通り,2022年度は本研究課題の研究計画「(2)階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」に関連する2つの研究を行い,国内の学会においてその研究成果を公表した.また,成果の公表までは至らなかったが,研究計画「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」に関連する研究についても研究を進めた.このように2022年度は複数の研究において新たな進展が得られた.その一方で,2022年度は既に成果が概ね得られていた研究「最小増加距離木問題に対する部分木交換操作に基づく局所探索アルゴリズム」に関する成果を論文としてまとめる予定であったが,上述した新たな研究を推し進めたためその作業が停滞している.こうしたことから現在までの進捗状況を「やや遅れている」と判断した.
|
Strategy for Future Research Activity |
これまでに,本研究課題の3つの研究計画「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」,「(2)階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」及び「(3)重複階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」のうち,(1)と(2)についてはいくつかの研究成果が得られ,既に国内の学会でその成果の発表を行った.2023年度以降ではこれらの研究成果を英語論文としてまとめた上で国際的な学術雑誌に投稿する予定である.また,2022年度から着手した「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」に関連する研究も引き続き研究を進めて行く予定である.「(3)重複階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」についてはまだその研究に着手していない段階であるが,2023年度から検討を始める予定である.
|
Report
(1 results)
Research Products
(2 results)