• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

図と地でとらえる巨大二部グラフクラスタリングとその応用

研究課題

研究課題/領域番号 19K12125
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関学習院大学

研究代表者

久保山 哲二  学習院大学, 付置研究所, 教授 (80302660)

研究期間 (年度) 2019-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード二部グラフ / クラスタリング / コミュニティ抽出 / 数え上げ / 二部クラスタリング / ネットワーク分析 / 行列分解 / 交差最小化
研究開始時の研究の概要

本研究では、商品とその購入者などの2つのカテゴリから構成される対象間の関係を記録したデータから、商品グループとそれに対応する購入者層のようなまとまりを見つけ出す問題に取り組む(この問題を二部クラスタリングとよぶ)。このような2者間の関係を2部グラフと呼ばれる構造によって表現し、膨大なデータを対象に問題を効率よく解くための手法の開発に新たな視点で取り組むとともに、既存手法の数理的な解析と新たな応用を探る。

研究実績の概要

本研究では申請書に示した目的に従い、大規模二部グラフデータから効率的にコミュニティを抽出する手法の開発に取り組んだ。グラフのハッシュ化によるスケッチ表現を用いた高速なフィルタリング手法の検討を進め、ある程度の成果を得ることができた。具体的には、スケッチ表現同士の非対称距離を活用することで、検索の再現率を高められることに着目し、複数のハミング距離ベースのスケッチ列挙を組み合わせる新たな手法を提案した。これにより、非対称距離を近似的に表現しつつ、並列処理による高速化を実現できることを示した。
また、本研究の一環として、バタフライ構造の数え上げ及びウイング分解に基づく階層的二部クラスタリングについて検討を行った。まず、大規模な二部グラフデータを対象に本手法を適用し、その性質を調査したところ、ハブ構造がクラスタリングを妨げる要因となることが判明した。そこで、前処理としてハブ構造の除去を組み込み、密度の高い部分構造が得られるよう手法の改良を行った。構造的には性質の良いクラスタを高速に抽出できる見通しが得られた。本研究の成果は、大規模なグラフ構造データの分析を加速する上で意義を持つと考えられる。提案手法によりコミュニティ抽出の計算効率が改善されれば、ソーシャルメディアなどの膨大なユーザ間の関係性を手軽に分析できるようになり、様々な応用が期待できる。引き続き、高速かつ実用的なグラフマイニング技術の確立を目指して研究を進める。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究課題については、実データを用いた実証に至る過程で、当初の計画から若干の遅れが生じているものの、概ね順調に進捗していると評価している。現時点での達成状況を鑑み、研究期間延長を行い、研究目的の完遂を図る予定である。
二部グラフのスケッチ表現を用いた高速フィルタリング手法の開発を行い、非対称距離の活用により検索性能を向上させる新たな手法を考案し、並列処理との組み合わせによる更なる高速化の可能性を示した。大規模データセットを用いた実験により、提案手法の有効性を確認した。また、階層的二部クラスタリングについても検討を進め、大規模二部グラフデータへの適用を通じて、手法の改良点を明らかにした。前処理としてハブ構造除去を組み込むことで、アルゴリズムの性能向上を図った。匿名化データによる予備実験では、良質なクラスタの高速抽出に向けて期待できる結果が得られている。残る研究期間では、提案手法の実データへの応用と分析を中心に進める計画である。実運用に向けた課題の洗い出しと解決に努め、効率的なグラフマイニング基盤の確立を目指す。

今後の研究の推進方策

本研究課題の残る期間においては、これまでに得られた知見と開発した手法を基盤として、より実践的な応用に向けた展開を図る。具体的には、提案した速フィルタリング手法について、実データへの適用を通じてその有効性を検証する。公共事業入札データ等から得られた大規模二部グラフデータを対象として、コミュニティ抽出への応用可能性を探る。その際、実データ特有のノイズや欠損への対処、計算リソースの最適化など、実運用に向けた課題の洗い出しと解決に努める。
また、階層的二部クラスタリングについては、ベンチマークデータによる予備実験で得られた知見を活かし、アルゴリズムの更なる改良を進める。特に、ハブ構造以外のノイズ構造への対応や、クラスタ粒度の自動決定手法の開発など、手法の汎用性と実用性の向上を目指す。並行して、実データを用いたケーススタディを行い、クラスタの解釈性の評価や、ユーザセグメンテーション、推薦システムなどの具体的なアプリケーションへの応用可能性を検討する。 これらの取り組みを通じて、二部グラフクラスタリングによる分析基盤の確立と、その実データへの応用を目指す。

報告書

(5件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (26件)

すべて 2024 2023 2022 2021 2020 2019

すべて 雑誌論文 (23件) (うち国際共著 10件、 査読あり 21件、 オープンアクセス 9件) 学会発表 (3件)

  • [雑誌論文] Fast Filtering for Similarity Search Using Conjunctive Enumeration of Sketches in Order of Hamming Distance2024

    • 著者名/発表者名
      N. Higuchi, Y. Imamura, V. Mic, T. Shinohara, K. Hirata, T. Kuboyama
    • 雑誌名

      International Conference on Pattern Recognition Applications and Methods (ICPRAM)

      巻: - ページ: 499-510

    • DOI

      10.5220/0012322700003654

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] 発話行動分析に基づく共食会話の心理的効果の一考察―銘々膳形式と共同膳形式の比較から―2023

    • 著者名/発表者名
      徳永 弘子、久保山 哲二、木村 敦、武川 直樹
    • 雑誌名

      電子電子情報通信学会論文誌A 基礎・境界

      巻: J106-A 号: 3 ページ: 104-113

    • DOI

      10.14923/transfunj.2022HAP0005

    • ISSN
      1881-0195
    • 年月日
      2023-03-01
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] スケッチを用いた検索における2段階フィルタリングの有効性の検証2023

    • 著者名/発表者名
      樋口 直哉、今村 安伸、篠原 武、平田 耕一、久保山 哲二
    • 雑誌名

      人工知能学会研究会資料 人工知能基本問題研究会

      巻: 123 号: 0 ページ: 24-29

    • DOI

      10.11517/jsaifpai.123.0_24

    • ISSN
      2436-4584
    • 年月日
      2023-01-05
    • 関連する報告書
      2022 実施状況報告書
  • [雑誌論文] 多様性の解析を用いたニュース記事に対するコメント集合の分析2022

    • 著者名/発表者名
      宇野 毅明, 武富 有香, 小林 亮太, 橋本 隆子, 久保山 哲二, 申 吉浩
    • 雑誌名

      じんもんこん2022論文集

      巻: 2022 ページ: 207-212

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] マイクロクラスタリングを用いた選挙公報テキスト分析2022

    • 著者名/発表者名
      杉山 佳奈美, 久保山 哲二, 三輪 洋文, 宇野 毅明
    • 雑誌名

      じんもんこん2022論文集

      巻: 2022 ページ: 289-294

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] Exploration of a large-scale reconstructed structure on GaN(0001) surface by Bayesian optimization2022

    • 著者名/発表者名
      Kusaba A.、Kangawa Y.、Kuboyama T.、Oshiyama A.
    • 雑誌名

      Applied Physics Letters

      巻: 120 号: 2 ページ: 021602-021602

    • DOI

      10.1063/5.0078660

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり
  • [雑誌論文] Nearest-neighbor Search from Large Datasets using Narrow Sketches2022

    • 著者名/発表者名
      Higuchi Naoya、Imamura Yasunobu、Mic Vladimir、Shinohara Takeshi、Hirata Kouichi、Kuboyama Tetsuji
    • 雑誌名

      Proceedings of the 11th International Conference on Pattern Recognition Applications and Methods

      巻: Vol. 1 - 978-989-758-549-4 ページ: 401-410

    • DOI

      10.5220/0010817600003122

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] 共食における銘々膳と共同膳の形式が参与者の会話行動に及ぼす影響2022

    • 著者名/発表者名
      徳永弘子, 久保山哲二, 木村敦, 武川直樹
    • 雑誌名

      電子情報通信学会技術研究報告 HCS2021-50

      巻: Vol.121, No.363 ページ: 43-48

    • 関連する報告書
      2021 実施状況報告書
  • [雑誌論文] A new combination of Hankel and sparsity-promoting dynamic mode decompositions and its application to the prediction of plasma turbulence2021

    • 著者名/発表者名
      Kusaba Akira、Kuboyama Tetsuji、Shin Kilho、Sasaki Makoto、Inagaki Shigeru
    • 雑誌名

      Japanese Journal of Applied Physics

      巻: 61 号: SA ページ: SA1011-SA1011

    • DOI

      10.35848/1347-4065/ac1c3c

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Random Number Generators in Training of Contextual Neural Networks2021

    • 著者名/発表者名
      Huk Maciej、Shin Kilho、Kuboyama Tetsuji、Hashimoto Takako
    • 雑誌名

      Lecture Notes in Computer Science 12672, Springer 2021, ISBN 978-3-030-73279-0

      巻: 12672 ページ: 717-730

    • DOI

      10.1007/978-3-030-73280-6_57

    • ISBN
      9783030732790, 9783030732806
    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] 伝統文様アノテーション自動化のための自然画像とフラクタル画像による事前学習2021

    • 著者名/発表者名
      鏡川 悠介, 久保山 哲二, 加茂 瑞穂, 前田 英作
    • 雑誌名

      じんもんこん2021論文集

      巻: 1 ページ: 260-267

    • NAID

      170000186272

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり
  • [雑誌論文] Sparsity-Promoting Dynamic Mode Decomposition of Plasma Turbulence2020

    • 著者名/発表者名
      KUSABA Akira、KUBOYAMA Tetsuji、INAGAKI Shigeru
    • 雑誌名

      Plasma and Fusion Research

      巻: 15 号: 0 ページ: 1301001-1301001

    • DOI

      10.1585/pfr.15.1301001

    • NAID

      130007789963

    • ISSN
      1880-6821
    • 年月日
      2020-01-06
    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Analyzing temporal patterns of topic diversity using graph clustering2020

    • 著者名/発表者名
      Hashimoto Takako、Shepard David Lawrence、Kuboyama Tetsuji、Shin Kilho、Kobayashi Ryota、Uno Takeaki
    • 雑誌名

      The Journal of Supercomputing

      巻: 77 号: 5 ページ: 4375-4388

    • DOI

      10.1007/s11227-020-03433-5

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Unsupervised Clustering based on Feature-value / Instance Transposition Selection2020

    • 著者名/発表者名
      A. Kusaba, T. Hashimoto, K. Shin, D. L. Shepard and T. Kuboyama
    • 雑誌名

      Proceedings of 2020 IEEE REGION 10 CONFERENCE (TENCON)

      巻: Volume 1 ページ: 1192-1197

    • DOI

      10.1109/tencon50793.2020.9293922

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Predictive Nonlinear Modeling by Koopman Mode Decomposition2020

    • 著者名/発表者名
      Kusaba Akira、Shin Kilho、Shepard Dave、Kuboyama Tetsuji
    • 雑誌名

      International Conference on Data Mining Workshops (ICDMW)

      巻: 1 ページ: 811-819

    • DOI

      10.1109/icdmw51313.2020.00118

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Pivot Selection for Narrow Sketches by Optimization Algorithms2020

    • 著者名/発表者名
      Higuchi Naoya、Imamura Yasunobu、Mic Vladimir、Shinohara Takeshi、Hirata Kouichi、Kuboyama Tetsuji
    • 雑誌名

      International Conference on Similarity Search and Applications (SISAP)

      巻: LNCS 12440 ページ: 33-46

    • DOI

      10.1007/978-3-030-60936-8_3

    • ISBN
      9783030609351, 9783030609368
    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] 狭い16ビットのスケッチを用いた高速最近傍検索2020

    • 著者名/発表者名
      樋口直哉, 今村安伸, 久保山哲二, 平田耕一, 篠原武
    • 雑誌名

      情報処理学会論文誌数理モデル化と応用(TOM)

      巻: 13(1) ページ: 13-22

    • NAID

      170000181812

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] Twitter Topic Progress Visualization using Micro-clustering.2019

    • 著者名/発表者名
      Hashimoto, T., Kusaba, A., Shepard, D., Kuboyama, T., Shin, K. and Uno, T.
    • 雑誌名

      Proc. of 9th International Conference on Pattern Recognition Applications and Methods

      巻: 1 ページ: 585-592

    • DOI

      10.5220/0009160805850592

    • 関連する報告書
      2020 実施状況報告書 2019 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] A Fast Algorithm for Unsupervised Feature Value Selection.2019

    • 著者名/発表者名
      Shin, K., Okumoto, K. Shepard, D., Kuboyama, T., Hashimoto, T., and Ohshima, H.
    • 雑誌名

      Proc. of 12th International Conference on Agents and Artificial Intelligence

      巻: 1 ページ: 203-213

    • DOI

      10.5220/0008981702030213

    • 関連する報告書
      2020 実施状況報告書 2019 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Time Series Topic Transition Based on Micro-Clustering2019

    • 著者名/発表者名
      Takako Hashimoto, Takeaki Uno, Tetsuji Kuboyama, Kilho Shin, Dave Shepard
    • 雑誌名

      IEEE International Conference on Big Data and Smart Computing (BigComp 2019)

      巻: - ページ: 1-8

    • DOI

      10.1109/bigcomp.2019.8679255

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Fast Filtering for Nearest Neighbor Search by Sketch Enumeration Without Using Matching2019

    • 著者名/発表者名
      Higuchi Naoya、Imamura Yasunobu、Kuboyama Tetsuji、Hirata Kouichi、Shinohara Takeshi
    • 雑誌名

      AI 2019: Advances in Artificial Intelligence - 32nd Australasian Joint Conference

      巻: LNCS11919 ページ: 240-252

    • DOI

      10.1007/978-3-030-35288-2_20

    • ISBN
      9783030352875, 9783030352882
    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Time Series Electricity Consumption Analysis using Non-negative Matrix Factorization2019

    • 著者名/発表者名
      Kusaba Akira、Kuboyama Tetsuji、Hashimoto Takako
    • 雑誌名

      IEEE 10th International Conference on Awareness Science and Technology, iCAST 2019

      巻: 1 ページ: 1-6

    • DOI

      10.1109/icawst.2019.8923311

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] Using Label Information in a Genetic Programming Based Method for Acquiring Block Preserving Outerplanar Graph Patterns with Wildcards2019

    • 著者名/発表者名
      Tokuhara Fumiya、Okinaga Shiho、Miyahara Tetsuhiro、Suzuki Yusuke、Kuboyama Tetsuji、Uchida Tomoyuki
    • 雑誌名

      11th IEEE International Workshop on Computational Intelligence and Applications, IWCIA

      巻: 1 ページ: 95-100

    • DOI

      10.1109/iwcia47330.2019.8955031

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] ラベル情報を利用した進化的学習による複合的なワイルドカード付きブロック保存型外平面的グラフパターンの獲得2020

    • 著者名/発表者名
      徳原 史也, 沖永 志帆, 宮原 哲浩, 鈴木 祐介, 久保山 哲二, 内田 智之
    • 学会等名
      人工知能学会第34回全国大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 動的モード分解におけるモード数低減手法の実験的比較2019

    • 著者名/発表者名
      草場彰
    • 学会等名
      人工知能基本問題研究会 110
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 遺伝的プログラミングによるワイルドカード付きブロック保存型外平面的グラフパターンの獲得2019

    • 著者名/発表者名
      宮原哲浩
    • 学会等名
      人工知能学会全国大会 JSAI2019
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi