• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

正則化法によるスパース推定と超高次元データへの応用

研究課題

研究課題/領域番号 24700277
研究機関大阪大学

研究代表者

廣瀬 慧  大阪大学, 基礎工学研究科, 助教 (40609806)

キーワードスパース推定 / 因子分析モデル / 非凸ペナルティ / モデル選択
研究概要

昨年度は因子分析モデルに正則化法を適用し,その理論的な性質について考察した.今年度はこの内容をさらに発展させ,すべての解を効率的に計算するアルゴリズムを構築した.また,そのアルゴリズムを実装するソフトウェアパッケージを公開した.
(1) 昨年度提案した因子分析のスパース推定法の計算アルゴリズムを改良した.まず,初期値を適切に設定するよう工夫した.また,EMアルゴリズムの内部のCoordinate Descentアルゴリズムを並列演算した.
(2) 提案手法を手書き文字データに適用し,その有効性を検証した.すると,因子負荷量が十分にスパースな場合においても(すなわち,画像が十分に圧縮されていても)画像をきれいに復元できることが分かった.
(3) 因子分析の正則化最尤推定値を高速に計算することができるソフトウェアRのパッケージfancを公開した.このパッケージには,あらゆる調整パラメータに対する因子と変数の関係性を可視化することのできる,グラフィカルツールを含む.このツールを用いることにより,分析者が因子を解釈しやすいモデルを探し,対応する適合度を見ることによって適切なモデルを選択するという,これまでなかった新たな解析が可能となった.
(4) 因子分析モデルにスパース推定を適用すると,第1因子がすべての変数に影響を与えるという直感に合わない結果が頻繁に得られた.その原因を因子回転の観点から探ったところ,正則化項の性質である,パラメータを正確に0と推定することが原因であることが判明した.また,この問題を解決するには,因子間相関を入れたモデルを用いるか,他の因子回転基準を用いれば良いということも分かった.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

正則化法に基づく因子分析では,新たな方法論を提案しただけでなく,従来の方法論との関係性を理論的に考察し,従来法よりスパースに推定できるという新たな知見を発見した.さらに,実際に高次元データに適用できるよう効率的なアルゴリズムを構築した.この方法論,理論,アルゴリズムを1つの論文としてまとめ,著名な国際ジャーナルに採択された.
また,グラフィカルツールを含むソフトウェアfancをWeb上に公開した.できるだけ多くの研究者に使ってもらえるよう,国内外で学会発表し,ソフトウェアパッケージについて詳しく述べた.

今後の研究の推進方策

因子間相関がある場合,スパース推定がうまく機能しないことを確かめたので,来年度は,因子間相関を考慮したモデリングを構築したい.具体的には,モデルを推定する際,因子負荷量,独自分散とともに因子間相関行列も同時に推定する.因子間相関の推定値は,解析的に求めることが困難であり,不安定になる可能性もある.そこで,ベイズアプローチに基づくモデルの推定を検討する.
また,スパース因子分析モデルを拡張した,スパース因子回帰モデリングを提案する.このモデルに対して変数選択を行うために,パラメータ行列の各行をグループと見なし,グループ単位で変数選択を行うスパース推定法を提案する.パラメータを効率的に計算するために,EMアルゴリズムとCoordinate Descentアルゴリズムを組み合わせたアルゴリズムを開発する.

次年度の研究費の使用計画

高性能な計算機を購入する予定であったが,次年度で発売される計算機のほうがはるかに高性能であることがわかったため,次年度に購入することにした.
(1) 統計数理研究所に出張し,スパース推定の研究に関するディスカッションを行う.また,因子間相関を考慮したモデリングや因子回帰モデリングに関する研究内容を国際会議で講演する.
(2) 大規模データを扱うための高性能な計算機を購入する.
(3) 高次元データ解析手法を構築するための理論とアルゴリズムに関する書籍を購入する.

  • 研究成果

    (8件)

すべて 2014 その他

すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (6件)

  • [雑誌論文] Sparse estimation via nonconcave penalized likelihood in a factor analysis model2014

    • 著者名/発表者名
      Hirose, K. and Yamamoto, M.
    • 雑誌名

      Statistics and Computing

      巻: 印刷中 ページ: 印刷中

    • 査読あり
  • [雑誌論文] Lassoタイプの正則化法に基づくスパース推定法を用いた超高次元データ解析2014

    • 著者名/発表者名
      廣瀬慧
    • 雑誌名

      京都大学 数理解析研究所講究録

      巻: 印刷中 ページ: 印刷中

  • [学会発表] 正則化スパース因子分析は因子回転に取って代わるのか?2014

    • 著者名/発表者名
      廣瀬慧,山本倫生
    • 学会等名
      2014年度統計関連学会連合大会
    • 発表場所
      東京大学本郷キャンパス(東京都文京区)
    • 年月日
      20140913-20140916
  • [学会発表] Lasso-type penalized maximum likelihood factor analysis via nonconvex penalties.2014

    • 著者名/発表者名
      Hirose, K., and Yamamoto, M.
    • 学会等名
      The 3rd Institute of Mathematical Statistics Asia Pacific Rim Meeting (APRM 2014)
    • 発表場所
      Howard International House, Taipei, Taiwan
    • 年月日
      20140629-20140703
  • [学会発表] Rパッケージ "fanc": L1型正則化法に基づく因子分析モデルのスパース推定とその可視化

    • 著者名/発表者名
      廣瀬慧,山本倫生,永田晴久
    • 学会等名
      日本計算機統計学会 第27回シンポジウム
    • 発表場所
      市民会館崇城大学ホール(熊本県熊本市中央区)
  • [学会発表] ガウシアングラフィカルモデルのスパース推定における正則化項の検討

    • 著者名/発表者名
      小倉幸弘,廣瀬慧,下平英寿
    • 学会等名
      日本計算機統計学会 第27回シンポジウム
    • 発表場所
      市民会館崇城大学ホール(熊本県熊本市中央区)
  • [学会発表] L1型正則化法を用いた職場の人間関係におけるつながり感回帰式の導出

    • 著者名/発表者名
      吉田学, 今田美幸, 廣瀬慧, 松尾真人
    • 学会等名
      2013年度統計関連学会連合大会
    • 発表場所
      大阪大学豊中キャンパス(大阪府豊中市)
  • [学会発表] Lasso-type penalized maximum likelihood factor analysis

    • 著者名/発表者名
      Hirose, K., and Yamamoto, M.
    • 学会等名
      Joint Statistical Meeting 2013
    • 発表場所
      Palais des congres de Montreal, Montreal, Canada

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi