2022 Fiscal Year Research-status Report
Development of Algorithms for Ultrametric Tree Optimization and Hierarchical Clustering Optimization
Project/Area Number |
22K11921
|
Research Institution | Shizuoka University |
Principal Investigator |
安藤 和敏 静岡大学, 工学部, 教授 (00312819)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 組合せ最適化 / クラスタリング / 系統樹 / デンドログラム / 超距離 |
Outline of Annual Research Achievements |
2022年度は,研究計画調書に記載した3つの研究計画のうち,「(2)階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」に関連する研究を行った.階層クラスタリングとは, 与えられたデータ集合を,類似するデータから成るクラスターへの分割の階層構造を求める手続きである.階層構造はクラスター木(あるいは,デンドログラム)と呼ばれる2分木によって表現される.Dasgupta (2016) はクラスター木に対する目的関数を導入し,階層クラスタリングの問題を組合せ最適化問題として定式化した.Dasgupta はこの問題がNP困難であることを示すと同時に,この問題に対して再帰的最疎カットアルゴリズムと呼ばれるO(φ)-近似アルゴリズムを与えた. 本研究では, Dasgupta (2016) の目的関数を最小化するクラスター木を見出す問題に対して, kSS操作 (k制限部分木交換操作)と呼ばれる2分木の変形操作に基づく局所探索アルゴリズムを提案し,このアルゴリズムの1反復あたりの計算時間がO(n min{2k+1,n}k)であることを示した. ここで, 1≦ k ≦ nである. さらに開発したアルゴリズムの実際的性能を数値実験によって評価した. Cohen-Addad et al. (2019) は,Dasgupta (2016) の目的関数を一般化して,許容的目的関数と呼ばれる階層クラスタリングに対する目的関数のクラスを定義した.許容的目的関数の定義は抽象的なものであり具体的な関数の形は与えられていなかったが,本研究では,3次以下の多項式を用いて定義される許容的目的関数に対する特徴付けを与えた.さらに, 再帰的最疎カットアルゴリズムはこのような許容的目的関数を最小化するクラスター木を求める問題に対するO(φ)-近似アルゴリズムであることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
【研究実績の概要】に記載した通り,2022年度は本研究課題の研究計画「(2)階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」に関連する2つの研究を行い,国内の学会においてその研究成果を公表した.また,成果の公表までは至らなかったが,研究計画「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」に関連する研究についても研究を進めた.このように2022年度は複数の研究において新たな進展が得られた.その一方で,2022年度は既に成果が概ね得られていた研究「最小増加距離木問題に対する部分木交換操作に基づく局所探索アルゴリズム」に関する成果を論文としてまとめる予定であったが,上述した新たな研究を推し進めたためその作業が停滞している.こうしたことから現在までの進捗状況を「やや遅れている」と判断した.
|
Strategy for Future Research Activity |
これまでに,本研究課題の3つの研究計画「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」,「(2)階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」及び「(3)重複階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」のうち,(1)と(2)についてはいくつかの研究成果が得られ,既に国内の学会でその成果の発表を行った.2023年度以降ではこれらの研究成果を英語論文としてまとめた上で国際的な学術雑誌に投稿する予定である.また,2022年度から着手した「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」に関連する研究も引き続き研究を進めて行く予定である.「(3)重複階層クラスタリング最適化問題に対する局所探索アルゴリズムの開発」についてはまだその研究に着手していない段階であるが,2023年度から検討を始める予定である.
|
Causes of Carryover |
次年度使用額が生じた主な原因は,2022年度に予定していた海外出張のために旅費が使用されなかったためである.これはコロナ禍のために海外出張が不可能であったということがその一因であるが,同時に今年度の研究成果を挙げるために予想以上の多くの時間が費やされたため,それらの研究成果を英語の論文としてとりまとめる作業に遅れが生じてしまったことも原因である.この次年度使用額については主に2023年度に行う研究成果発表のために使用する予定である.
|