研究課題/領域番号 |
16K16128
|
研究機関 | 近畿大学 |
研究代表者 |
濱砂 幸裕 近畿大学, 理工学部, 講師 (70610559)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | クラスタリング / グラフクラスタリング / ソフトコンピューティング / 知識融合 / 構造的ゆらぎ / ゆらぎモデル / Modularity / 妥当性基準 |
研究実績の概要 |
クラスタリングはデータの規則性や構造を発見する手法として知られている。近年では、大規模データに潜む因果関係や相互作用の解明を目的として、グラフデータのクラスタリング(グラフクラスタリング)が注目を集めている。しかしグラフデータは、個体間の情報を表現するという特徴ゆえに、構造的ゆらぎを避けることができず、データ本来の情報に基づいて解析が行われているとは言い難い。そこで本研究では、ゆらぎの無視から重視という発想の転換を着想とする新たな知識融合型クラスタリングの構築を目的とする。さらに、構造的ゆらぎに対する知識のモデル化とクラスタリングの融合という見地から手法の開発を進め、大規模・不確実・不確定なデータを柔軟に処理するデータ解析の新たな方法論の構築を目指す。 平成29年度は研究計画に従い、知識ベースに基づくグラフクラスタリングの開発および評価について番号順に実施した。1.知識ベースの検討として、グラフデータ、構造的ゆらぎ、クラスタリング手法、ゆらぎモデルの4つを構成要素とする知識融合型クラスタリングのフレームワークを検討した。2.開発手法の評価および既存手法との比較について、開発手法の特徴を明らかにするための評価指標として、妥当性基準および情報量基準を検討した。これらを用いて、分類規則の特徴、適切に処理できるデータの規模、計算時間について評価したところ、一部の開発手法においてグラフクラスタリングの代表的手法であるLouvain法を上回る結果となった。3.ゆらぎモデルおよび知識ベースの再構築として、上記の評価結果から、有効性が明らかとなったゆらぎモデルを拡張し、知識ベースの修正を行った。また、知識ベース、数理モデル、クラスタリング手法を適宜修正し、構造的ゆらぎに関する知識の不足領域について調査し、知識融合型クラスタリングの再開発を進めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成29年度に予定していた研究計画の各項目について達成度を、計画以上(A)、計画通り(B)、計画よりやや遅れている(C)、計画よりかなり遅れている(D)、の4段階で評価する。 1.知識ベースに基づくグラフクラスタリングの開発について、平成29年4月から9月にかけて行う予定だった。特に、グラフデータに対する知識ベースとの融合として、グラフデータ、構造的ゆらぎ、クラスタリング手法、ゆらぎモデルの4つを構成要素とする知識融合型クラスタリングのフレームワークを検討した。また、フレームワークに基づくグラフクラスタリング手法の類型を行い、開発が必要となる手法について明らかにした。(B)評価。 2. 開発手法の評価および既存手法との比較について、平成29年度中に行う予定だった。開発手法の特徴を明らかにするための評価指標として、妥当性基準および情報量基準を検討し、人工データおよびベンチマークデータによる評価を行った。評価項目として、分類規則の特徴、適切に処理できるデータの規模、計算時間について評価したところ、開発した手法および妥当性基準の一部において代表的手法であるLouvain法を上回る結果が得られた。(A)評価。 3. ゆらぎモデルの修正および知識ベースの再構築について平成29年度9月から実施予定だった。前項の評価結果から、有効性が明らかとなったゆらぎモデルを拡張し、知識ベースの修正を行った。また、平成29年度上半期から着手したフレームワークに基づき、知識ベース、数理モデル、クラスタリング手法を適宜修正した。さらに、構造的ゆらぎに関する知識の不足領域について調査し、グラフデータの定量的評価に基づくクラスタ数推定が新たな課題となった。そのため、これまでに開発したモデル・手法・フレームワークを再検討し、知識融合型クラスタリングの再開発を進めた。(B)評価
|
今後の研究の推進方策 |
平成29年度までの研究計画は当初計画に従って遂行された。平成30年度は、知識ベースに基づくグラフクラスタリングの再開発を進め、大規模データマイニングの実現を目的とし、以下の当初計画の予定通りに遂行していくこととする。 1. 知識融合型クラスタリング技法の再開発:前年までに開発した知識融合型クラスタリングについて、検討が不十分な領域を明らかにし、該当する手法の再開発および評価を引き続き行う。特に、ファジィグラフなどのソフトコンピューティング手法および確率モデルによる検討を重点的に行い、本研究課題の知識ベースに適切な諸技法について検討する。 2.大規模データマイニングの実用化:大規模ベンチマークデータおよび実データの検討を通じて、データの規模・複雑さ・分類性能などの観点から、本研究課題で開発した知識融合型クラスタリングの特徴を明らかにする。比較的規模の大きいデータも対象として解析事例を蓄積し、実用化に必要となる項目の改善を進める。 3.知識ベースの高度化および開発手法の包括的発展:これまでの検討をもとに、新たなグラフクラスタリング手法の確立、知識融合型クラスタリングに基づく大規模データマイニングの実現、大規模・不確実・不確定なグラフデータに対する知識ベースとモデルの構築、の3点について検証し、知識融合型クラスタリングの包括的発展に取り組む。本研究課題は、構造的ゆらぎに対する知識のモデル化とクラスタリングの融合という見地から手法の開発を進め、データ解析の新たな方法論の構築を目指しており、数理モデル構築・クラスタリング手法の開発・実用化の3点を重視して進める。
|