研究概要 |
本研究では,近年グラフ理論の分野で提案されたグラフのb彩色という概念に着目し,この彩色が満たすべき2つの制約を,それぞれ局所的な制約と大域的な制約に対応させることにより,グラフの彩色に基づくクラスタリングの基礎理論の確立と,この理論に基づくアルゴリズムの開発を目指す. 上記の目的の実現のために,本年度は,主にグラフに対する彩色に基づいてクラスタリングを行う手法を計算機上にプロトタイプシステムとして実装し,クラスタリングの研究において標準的に用いられているベンチマークデータに対して適用し,精度や計算速度の観点から提案手法の評価を行い,その成果を発表した.具体的には,下記の項目を実施した. 1)与えられた非類似度に基づいてまず完全グラフを構築し,次に閾値以下の辺を削除してグラフを構築する必要があるが,グラフ構築に用いる非類似度および閾値がクラスタリング精度に影響を及ぼす可能性がある.このため,これらがクラスタリング精度に与える影響の評価をおこなった. 2)大規模データの処理の観点から,昨年度に検討したアルゴリズムの計算量を見積もり,計算量のボトルネックとなる箇所を同定し,アルゴリズムを改良した. 3)改良したアルゴリズムを計算機上にプロトタイプシステムとして実装し,標準的に用いられているベンチマークデータに対して適用し,精度や計算速度の観点から提案手法の評価を行った. 4)本研究課題を通じて得られた成果をまとめ,国際会議などで発表した.
|