研究課題/領域番号 |
18K11180
|
研究機関 | 静岡大学 |
研究代表者 |
安藤 和敏 静岡大学, 工学部, 准教授 (00312819)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | アルゴリズム / クラスタリング / 超距離 / デンドログラム |
研究実績の概要 |
クラスタリングは機械学習における重要な教師なし学習の一つである.クラスタリング手法の一つに(凝集的)階層クラスタリングがあり,この中でも単純連結法と完全連結法は代表的なものである.階層クラスタリングによって生成されるクラスタの階層はデンドログラムと呼ばれる図式によって表現されるが,デンドログラムは超距離木と呼ばれる重み付き根付き木とみなすこともできる.また,超距離木には超距離と呼ばれる相違写像のクラスが一対一に対応する. 閉路完全距離は超距離の自然な拡張であり,閉路完全距離のクラスは指標付き無閉路2-階層構造と呼ばれるデンドログラムの拡張に一対一に対応する.指標付き階層構造の各階層はXの分割であるのに対して,指標付き無閉路2-階層構造の各階層にある異なる2つの集合は交わりを持つことが許される.研究代表者らは2019年度に閉路完全距離に対応する階層重複クラスタリングアルゴリズムの開発を行った.これらのアルゴリズムは,単純連結法及び完全連結法の自然な拡張である. 2020年度は,研究計画調書に記載した3つの研究課題のうち,「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」及び「(2)閉路完全距離のグラフ表現と閉路完全距離による相違写像の近似」に関連する研究を行った.(1)に関しては,研究計画書に記載した最小増加超距離木問題に対する2分木の変形操作に基づく局所探索アルゴリズムの効率的な実装方法を開発し,このアルゴリズムが既存の実装方法よりも理論的にも実際的にも効率的であるということを示した.(2)に関しては,昨年度に引き続き開発した拡張単純連結法及び拡張完全連結法の出力の特徴付けとこれらのアルゴリズムの理論的計算時間の導出を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
【研究実績の概要】に記載した通り,2020年度は「(2)閉路完全距離のグラフ表現と閉路完全距離による相違写像の近似」に関連する研究,具体的には2019年度に開発した拡張単純連結法及び拡張完全連結法の出力の特徴付けと理論的計算時間の導出を行った.これらのアルゴリズムの出力の特徴付けに関する定理の証明とこれらのアルゴリズムの理論的計算時間の導出を行っている過程で,無閉路2-階層構造の定義を見直す必要があった.そのために,これらの証明と計算時間の導出のために,当初予想していたよりも多くの時間がかかってしまったのが研究の遅延の大きな要因である.また,コロナ禍により研究代表者の担当する授業のオンライン化のために多くの時間を割いてしまったために研究のための時間が少なくなってしまったということも一因に挙げられる.
|
今後の研究の推進方策 |
「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」及び「(2)閉路完全距離のグラフ表現と閉路完全距離による相違写像の近似」に関連する2020年度の研究成果については,2021年度に論文にまとめて学術雑誌に投稿する予定である.また,既に2018年度に成果が得られている研究計画調書に記載した課題「(3) k-連結完全距離による相違写像の近似理論の確立」に関連する研究についても,関連する研究の調査を行った後に2021年度に論文にまとめて学術雑誌に投稿する.「(1)最良近似超距離木問題に対する局所探索アルゴリズムの開発」に関連する研究成果については,超距離木に関する最適化問題を階層クラスタリングに関する最適化問題としてとらえなおすことによって,最適な階層クラスタリンを求める局所探索アルゴリズムの可能性についても今後の研究課題として検討する.
|
次年度使用額が生じた理由 |
次年度使用額の約50万円が生じた原因は,2020年度に予定していた海外出張のために旅費が使用されなかったためである.コロナ禍のために海外出張が不可能であるということがその一因であるが,同時にオンライン授業の対応による授業負担の増加によって2020年度に予定していた研究成果のとりまとめに遅れが生じてしまったことも原因である.この次年度使用額については主に2021年度に行う研究成果発表のために使用する予定である.
|