研究課題/領域番号 |
26330270
|
研究機関 | 筑波大学 |
研究代表者 |
宮本 定明 筑波大学, システム情報系, 教授 (60143179)
|
研究分担者 |
遠藤 靖典 筑波大学, システム情報系, 教授 (10267396)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | ネットワーククラスタリング / Ward法 / 2段階階層クラスタリング / 非対称類似度 / SNSデータ |
研究実績の概要 |
計画に従い、以下の項目について研究を進めた。 1.理論的考察の継続:本年度に得られた最も大きな理論的成果は、Ward法の適用限界を従来に比べて格段に拡げたことである。Ward法は階層的クラスタリングアルゴリズムのうち、最も好まれているものであるが、SNSデータのように類似度/非類似度が直接与えられる場合、類似度行列が半正定値であるときにのみ適用可能であるということが従来知られていた。そのため、一般の類似度行列は正定値カーネルに変換するような工夫が必要であった。ところが、本研究で得られた理論的成果は、類似度行列が負の固有値をもつ場合でもWard法を適用しても「おおむね」差し支えないというものである。この結果は従来の常識を変革するものである。「おおむね」というところは注意が必要であるが、本結果を既に研究会で発表し好評であったが、さらに28年度に更に結果を精密に述べることによって普及をはかっていく。また、上記技法とは別に、非対称類似度に対する2重メドイドクラスタリング技法を提案し、2段階クラスタリングアルゴリズムを開発した。 2.提案アルゴリズムと既存手法との比較:既存手法であるNewman法等とここで提案した2段階アルゴリズムを比較し、レポジトリによる評価、実行時間などの比較を行った。2段階アルゴリズムとNewman法とを比べたとき、分類の正確さに関する評価尺度では、一長一短であり、提案手法には一定の効果がみられた。実行時間では、Newman法との間では大きな差はなかったが、Newman法の非階層版であるLouvain法には及ばなかった。 3.SNS等データへの適用とその評価:レポジトリと独自に取得したデータについて、提案法と既存手法を利用し、その効果、効率を評価した。結果はおおむね、第2項に述べた通りであった。 4.さらに、ネットワーク上のc-回帰技法を提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度までの成果のなかで、最も画期的であるのは、上記1に述べたWard法に関する成果であり、研究当初に予想していない従来の常識を書き換えるブレークスルーたる成果が得られた。なぜなら、Ward法をネットワークに応用する際、カーネル化を省略できるからである。他の点についても、当初の計画通り順調に進んであり、得られたクラスタリングアルゴリズムは、伝統的技法の延長上にある樹形図出力を有するため、従来の提案手法よりも解釈がしやすいと考えられる。レポジトリーデータやリアルSNSデータでの検証も予定通り進んでいる。当初の計画以外にネットワーク上のc-回帰技法を提案している。 このように、初めに挙げた点と最後の点で計画以上の成果を得ており、他の点でも当初の計画通りに進んでいると自己評価できる。 なお、研究計画には、成果の発表をwebを通じて行っていくことを述べたが、筑波大学図書館のレポジトリが最も便利で世界的通用性があるとわかったため、レポシトリを積極的に活用している。また、予備的成果の発信にリスク工学専攻紀要を利用している。
|
今後の研究の推進方策 |
当初の計画では、代表者が定年に達するため、今年度末までにアルゴリズム開発をおおよそ終了し、最終年度は結果の整理とデータへの適用、手法の評価、成果発表を行うということとしていた。この計画におおむね変更はないが、実績概要のはじめに述べたWard法に関する成果の普及は重要であると考えられるので、この成果をいま一度整理し直して正確かつわかりやすく記述することにも重点を置く。また、本年度に得られた成果のなかで未発表のものについては発表を行っていく。発表については、2016年度に行われる国内研究会(ファジィシステムシンポジウム等)、国際学会(SCIS&ISIS2016等)、さらに筑波大学図書館レポジトリを利用して情報発信していく予定である。 繰り返しになるが、本年度までに研究計画に述べた事項を検討した結果、従来法に匹敵するアルゴリズムを開発し、さらに階層的クラスタリングに関するブレイクスルーといえる理論的成果を得たので、最終年度はこれらの普及に努める。
|