研究概要 |
類似度に応じてオブジェクトをいくつかのグループに分類するクラスタリング問題は統計学の古典的な問題であり,医学,生物学,人類学,経済学,情報科学等様々な分野で実際に幅広く活用されている. この問題は与えられたオブジェクト間の類似度による評価関数を最適化する離散最適化問題と考えることができるが,応用によって類似度および評価基準にはさまざまな種類が存在し,この違いによりそれぞれの問題が別個のものとして取り扱われていることが多い.特にオブジェクト間の類似度の与え方によっては問題が良い幾何構造を持つ場合が多いが,殆んどの場合この幾何構造が充分に活用されているとは言い難い. 本研究では良い幾何構造を持つクラスタリング問題,特に多様体の分割問題と捉えることのできるクラスタリング問題に着目し問題を統一的に扱うための抽象的な枠組を提示し一旦この枠組の上で問題に共通する本質の解析および解法の提案を行ない,その上で個別の共通しない部分に関するより細かい解析の追加および既存の結果との整合性の検証を行なった. 双対平坦という良い幾何的な性質を持つ多様体を特徴多様体と定義し,その上で定義される一般形ダイバージェンスを類似度とし加算的評価基準を持つクラスタリング問題について最適解が持つ幾何的性質および最適解を得るための計算量を明らかにした上で厳密解法および,より実際的な近似解法を提案した.また近似解から局所最適解を構成するための局所改良法の適用についての考察を行ないまた計算機実験を行ない理論的な結果が実験により裏付けられることを示した.
|