• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

EMアルゴリズムによる混合モデルの初期値選択法の提案とその加速に関する研究

研究課題

研究課題/領域番号 16K00061
研究機関岡山理科大学

研究代表者

黒田 正博  岡山理科大学, 総合情報学部, 教授 (90279042)

研究分担者 足立 浩平  大阪大学, 人間科学研究科, 教授 (60299055)
飯塚 誠也  岡山大学, 全学教育・学生支援機構, 教授 (60322236)
森 裕一  岡山理科大学, 総合情報学部, 教授 (80230085)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワード初期値選択 / EMアルゴリズム / 収束の加速
研究実績の概要

本研究課題で対象にしているEMアルゴリズムや交互最小二乗法といった反復法は,局所収束することがわかっている.したがって,目的関数を最大化(交互最小二乗法の場合は最小化)するパラメータの推定問題において,初期値の選択が重要である.一般的には,複数個の初期値を用意し,これらから上記の反復法を用いてパラメータ推定をおこない,目的関数を最大化するものを見つける方法が取られる.しかし,これには試行回数と各試行での反復回数の掛け算となり,多大な反復回数とそのための計算時間が必要である.また,仮定する統計モデルの構造が複雑化し,それに伴いパラメータ数も増大するとき,この問題は深刻である.
この問題を解決するために,本年度の研究では,これまでに提案されたEMアルゴリズムにおけるパラメータの初期値選択法に我々の開発した加速法を組込むことで,反復回数の減少と,それに伴う計算時間の短縮を目指した手法を開発した.そして,数値実験により,その加速性能を評価し,提案手法の有効性を評価した.初期値選択をおこなった後は,これで得られた値をパラメータの初期値としてパラメータ推定をおこなうことになるが,この計算過程にも我々の加速法を用いることで,反復回数と計算時間の短縮を実現した.「初期選択」と「パラメータ推定」という2つの計算において,EMアルゴリズムの加速法を適用することで,全体として大幅な総反復回数と総計算時間の短縮を実現することができた.
さらに,初期値依存が解析における大きな問題となる非負行列分解にも,EMアルゴリズムの初期値選択法を応用し,数値実験による性能比較をおこない有効性を検証することができた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究の第一歩として,これまでに提案されているEMアルゴリズムの初期選択法についてサーベイをおこなった.そして,実際のデータ解析でよく使われているものをピックアップし,その手法における加速法の適用の可否を検討した.その中で,emEMアルゴリズムと呼ばれる標準的な初期値選択手法において,我々の提案した加速法が適用できることが確認できた.そこで,このアルゴリズムを拡張したEMアルゴリズムの初期値選択法を開発し,数値実験により性能評価をおこなった.この数値実験により,加速法を組込むことで反復回数と計算時間の短縮が図ることができ,研究の初期段階として十分な成果が得られたと考えている.

今後の研究の推進方策

EMアルゴリズムの初期値選択のための手法として,決定論的なアプローチによる手法が近年において提案されてきている.今後は,この新しい手法についてのアルゴリズムの検討をおこなうとともに,モデル平均(Model averaging)法による初期値選択法の研究とその加速化についても研究を深めていきたいと考えている.
初期値選択法については,統計モデルに依存して最良の手法は1つに限定できないことが一般的に言われており,複数個と初期選択手法をターゲットにし,様々な場面でそれに適した手法を提案できるよう,これらの改良するとともに,これらをベースに新しい初期値選択手法の開発をおこなっていきたいと考えている.

次年度使用額が生じた理由

海外での国際会議への出席を予定していたが,大学業務との調整がつかず海外出張を見送ることになった.そのために,配分された経費を執行することが出来なかった.

次年度使用額の使用計画

12月にニュージーランドで開催されるIASC-ARS/NZSA への学会出張費に,2017年度配分される経費を使用することにしており,その不足分に充てることを考えている.また,国内の学会出張費にも使用する予定である.

  • 研究成果

    (7件)

すべて 2017 2016

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件) (うち国際学会 3件) 図書 (2件)

  • [雑誌論文] Fixed factor analysis with clustered factor score constraint2017

    • 著者名/発表者名
      Uno, K., Satomura, H. and Adachi, K.
    • 雑誌名

      Computational Statistics and Data Analysis

      巻: 94 ページ: 265-274

    • DOI

      j.csda.2015.08.010

    • 査読あり
  • [学会発表] Acceleration of convergence of the alternating least squares algorithm for mixed measurement level multivariate data2016

    • 著者名/発表者名
      Kuroda, M., Mori, Y., Iizuka, M. and Sakakihara, M.
    • 学会等名
      The 10th International Chinese Statistical Association (ICSA) international conference
    • 発表場所
      上海(中国)
    • 年月日
      2016-12-19 – 2016-12-22
    • 国際学会
  • [学会発表] Acceleration of iterative methods for nonnegative matrix factorization2016

    • 著者名/発表者名
      Mori, Y., Sakakihara, M., Kuroda, M. and Iizuka, M.
    • 学会等名
      COMPSTAT 2016
    • 発表場所
      オビエド(スペイン)
    • 年月日
      2016-08-23 – 2016-08-26
    • 国際学会
  • [学会発表] Fast estimation using the EM algorithm for Gaussian mixture models2016

    • 著者名/発表者名
      Kuroda, M.
    • 学会等名
      The 4th Institute of Mathematical Statistics Asia Pacific Rim Meeting
    • 発表場所
      香港(中国)
    • 年月日
      2016-06-27 – 2016-06-30
    • 国際学会
  • [学会発表] リスタートを用いた加速化交互最小二乗法による非計量主成分分析の変数選択法につい て2016

    • 著者名/発表者名
      黒田正博, 森 裕一, 飯塚誠也
    • 学会等名
      日本計算機統計学会第30回大会
    • 発表場所
      京都
    • 年月日
      2016-05-19 – 2016-05-20
  • [図書] Nonlinear Principal Component Analysis and Its Applications2016

    • 著者名/発表者名
      Mori. Y., Kuroda, M., Makino, N.
    • 総ページ数
      80
    • 出版者
      Springer
  • [図書] Matrix-Based Introduction to Multivariate Data Analysis2016

    • 著者名/発表者名
      Adachi,K.
    • 総ページ数
      301
    • 出版者
      Springer

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi