• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

内在的構造を持つ大規模高次元データ解析の理論と方法

研究課題

研究課題/領域番号 26280009
研究機関統計数理研究所

研究代表者

福水 健次  統計数理研究所, 大学共同利用機関等の部局等, 教授 (60311362)

研究分担者 鈴木 大慈  東京工業大学, 情報理工学(系)研究科, 准教授 (60551372)
小林 景  統計数理研究所, 数理推論研究系, 助教 (90465922)
研究期間 (年度) 2014-04-01 – 2019-03-31
キーワード統計的学習理論 / 高次元データ / 機械学習
研究実績の概要

本年度は、(1)内在的構造を持つ高次元データの数理、(2)高次元データに対するカーネル法の理論と方法、に関して以下のような研究成果が得られた。

(1)高次元データに典型的に表れるハブ構造(多くのデータの最近点として表れるデータ点)を持つ高次元データに関して研究を行った。ハブ現象は大規模データベース検索などに悪影響を及ぼすことが知られており、その解消法が重量な技術となる。通常はコサイン類似度の場合にハブ現象を議論することが多いが、本研究ではユークリッド距離を用いた場合のハブ現象の理論解析と、ハブ解消法の提案を行った。データベース検索のタスクにン用いたところ、提案手法は今までのハブ解消法よりも優れた結果を示すことが分かった。この研究の成果は、人工知能分野のトップ国際会議AAAI2016に採択された。また、ツリー上に分布するデータの解析に対する基礎的研究として、距離関数が木のグラフから与えられるための条件について調べ、成果を国際論文誌に投稿し採択された。

(2)2つの異なるドメインのデータにクラスタ構造があることを仮定して、カーネル法を用いて、これらのクラスタをマッチングさせる方法を研究した。特に、データ間の類似度などを全く与えられていない教師なしの状況をターゲットとした。研究の結果、カーネル平均とカーネル化ソーティングを組み合わせたグループ・カーネル化ソーティング法を提案した。これをWikipediaの対応する項目グループの多言語間でのマッチングに適用したところ、既存の方法よりも良好な結果が得られることが分かった。この成果は、国際雑誌 Data Mining and Knowledge Discoveryに掲載が決定している。
また、カーネル法による無限次元指数分布族の理論に関して理論解析を行い、収束レートの下限に関して考察を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

実績欄で述べたように、課題(1)(2)に対して研究成果が出ており、トップクラスの国際会議や論文誌に採択されている。一方、高次元データに関するカーネル法の理論や、効率的アルゴリズムに関しては検討を進めている段階のものもある。この状況を総合して、研究はおおむね順調に進んでいると判断する。

今後の研究の推進方策

以下の2点に注力する予定である。
・カーネル指数分布族の収束性の理論解析。特に収束レートの下限に関して、共同研究者である Bharath Sriperumbudur (Pennsylvania State University)との議論を密に行い、誤差の評価方法も含めて検討を行っていく。
・効率的アルゴリズム: スパース正則化の高速アルゴリズムの適用を検討する。

次年度使用額が生じた理由

カーネル法による無限次元指数分布族に関する共同研究を2016年3月に行うために、Pennsylvania State University の Bharath Sriperumbudur 氏を招へいするために予算を確保していたが、先方の都合により日程を設定することが困難となった。そのため、翌年度に招へいを延期することにした。

次年度使用額の使用計画

2016年度の10月ごろに Bharath Sriperumbudur 氏を招へいする予算として使用する計画である。

  • 研究成果

    (8件)

すべて 2017 2016 2015 その他

すべて 国際共同研究 (2件) 雑誌論文 (5件) (うち国際共著 1件、 査読あり 5件、 オープンアクセス 3件、 謝辞記載あり 2件) 備考 (1件)

  • [国際共同研究] University of Novi Sad(Serbia)

    • 国名
      セルビア
    • 外国機関名
      University of Novi Sad
  • [国際共同研究] Pennsylvania State University(米国)

    • 国名
      米国
    • 外国機関名
      Pennsylvania State University
  • [雑誌論文] A Characterization of Minimum Spanning Tree-like Metric Spaces2017

    • 著者名/発表者名
      Momoko Hayamizu, Hiroshi Endo and Kenji Fukumizu
    • 雑誌名

      IEEE/ACM Transactions on Computational Biology and Bioinformatics

      巻: 14 ページ: 468-471

    • DOI

      10.1109/TCBB.2016.2550431

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Unsupervised Group Matching with Application to Cross-lingual Topic Matching without Alignment Information2016

    • 著者名/発表者名
      Iwata, T., Kanagawa, M., Hirao, T. and Fukumizu, K.
    • 雑誌名

      Data Mining and Knowledge Discovery

      巻: 2016 ページ: 1-19

    • 査読あり / オープンアクセス
  • [雑誌論文] Flattening the Density Gradient for Eliminating Spatial Centrality to Reduce Hubness2016

    • 著者名/発表者名
      Hara, K., Suzuki, I., Kobayashi, K., Fukumizu, K. and Radovanovic, M.
    • 雑誌名

      Proc. 30th AAAI Conference on Artificial Intelligence

      巻: 1 ページ: 1659-1665

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] System Identification and Parameter Estimation in Mathematical Medicine: Examples Demonstrated for Prostate Cancer2016

    • 著者名/発表者名
      Yoshito Hirata, Kai Morino, Taiji Suzuki, Qian Guo, Hiroshi Fukuhara, and Kazuyuki Aihara
    • 雑誌名

      Quantitative Biology

      巻: 4(1) ページ: 13-19

    • DOI

      10.1007/s40484-016-0059-0

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Stochastic Alternating Direction Method of Multipliers for Structured Regularization2015

    • 著者名/発表者名
      Taiji Suzuki
    • 雑誌名

      Journal of Japan Society of Computational Statistics

      巻: 28 ページ: 105-124

    • 査読あり
  • [備考]

    • URL

      http://www.ism.ac.jp/~fukumizu/

URL: 

公開日: 2017-01-06   更新日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi