• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

大規模・複雑データに対するクラスタリング法の開発とその理論的性質の解明

研究課題

研究課題/領域番号 20K19756
研究機関大阪大学

研究代表者

寺田 吉壱  大阪大学, 基礎工学研究科, 講師 (10738793)

研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード計算量削減 / 漸近理論
研究実績の概要

本年度の研究では, 大規模なクラスタリングにおける汎用的な計算量削減方法の開発とその理論的性質の解明を行った. 具体的には, データの背後の分布(母集団分布)の構造を壊さないようなデータの代表点の計算方法である密度保存ベクトル量子化法 (Density-Preserving Vector Quantization; DPVQ) を提案した. DPVQは, 単純な重み付きk-means法であり, 大規模なデータに対しても容易に適用可能である. また, 提案手法によって生成された代表点の経験分布が漸近的に母集団分布に収束することを証明した. 提案手法により生成した(サンプルサイズよりも少ない)代表点に対して, クラスタリング法を適用し, その結果を元のデータに反映させることで, 大幅に計算コストを削減することができる. 提案した計算量削減法はどのようなクラスタリング法に対しても適用可能であることが大きな利点である. クラスタリング法は, 大規模・複雑なデータから背後のグループ構造を獲得するために有用であるが, 大規模なデータに対してはk-means法のような単純な方法のみが適用されており, データの背後のクラスタ構造を十分に捉えることができない可能性がある. 提案手法による代表点を用いた計算量削減法を用いることで, より柔軟なクラスタ構造を捉えることのできるspectral clusteringなどの計算コストの高い方法を高速に実行できるようになった.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度は,計画通り, 計算量削減法の開発及びその理論的性質の解明の両面で成果が得られた.

今後の研究の推進方策

今後の研究方針としては,先ず本年度に得られた成果の論文化に重点をおいて推進していく予定である.その後, spectral clusteringやnormalized cutに特化した計算量削減法の開発に着手する.

次年度使用額が生じた理由

本年度は, 新型コロナウイルス感染症の影響で参加予定の会議がオンライン開催となったことに加え, 研究打ち合わせなどを対面で行うことができなかったため, 次年度使用額が生じた. 次年度は, 論文執筆のため数値実験に利用する高性能な計算機の購入, 感染拡大に留意した対面での研究打ち合わせのための旅費として使用する.

  • 研究成果

    (6件)

すべて 2020 その他

すべて 国際共同研究 (1件) 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 2件) 学会発表 (2件) (うち招待講演 1件)

  • [国際共同研究] Erasmus University Rotterdam(オランダ)

    • 国名
      オランダ
    • 外国機関名
      Erasmus University Rotterdam
  • [雑誌論文] Statistical analysis of sparse approximate factor models2020

    • 著者名/発表者名
      Poignard Benjamin、Terada Yoshikazu
    • 雑誌名

      Electronic Journal of Statistics

      巻: 14 ページ: 3315~3365

    • DOI

      10.1214/20-EJS1745

    • 査読あり / オープンアクセス
  • [雑誌論文] Classification from only positive and unlabeled functional data2020

    • 著者名/発表者名
      Terada Yoshikazu、Ogasawara Issei、Nakata Ken
    • 雑誌名

      The Annals of Applied Statistics

      巻: 14 ページ: 1724~1742

    • DOI

      10.1214/20-AOAS1404

    • 査読あり / オープンアクセス
  • [雑誌論文] Fast generalization error bound of deep learning without scale invariance of activation functions2020

    • 著者名/発表者名
      Terada Yoshikazu、Hirose Ryoma
    • 雑誌名

      Neural Networks

      巻: 129 ページ: 344~358

    • DOI

      10.1016/j.neunet.2020.05.033

    • 査読あり
  • [学会発表] クラスタリングにおける汎用的な計算コスト削減法について2020

    • 著者名/発表者名
      寺田吉壱、山本 倫生
    • 学会等名
      2020年度統計関連学会連合大会
  • [学会発表] 大規模なクラスタリングにおける計算量削減法について2020

    • 著者名/発表者名
      寺田吉壱、山本 倫生
    • 学会等名
      第5回 統計・機械学習若手シンポジウム
    • 招待講演

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi