• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

スパース正則化による判別とグループ化に基づく意思決定システムの構築

研究課題

研究課題/領域番号 25330049
研究機関統計数理研究所

研究代表者

川崎 能典  統計数理研究所, 大学共同利用機関等の部局等, 准教授 (70249910)

研究分担者 植木 優夫  東北大学, 学内共同利用施設等, 助教 (10515860)
赤司 健太郎  学習院大学, 経済学部, 准教授 (50610747)
研究期間 (年度) 2013-04-01 – 2016-03-31
キーワードスパース正則化法 / 分類・パターン認識 / 変数選択 / 変数グルーピング / 高次元分割表解析 / リスク解析 / 多重共線性
研究実績の概要

カテゴリカルな応答変数に対して説明変数候補が膨大で、交互作用項が組合せ爆発的に多い状況を考える。このようなデータセットに対し、高次元分割表解析による情報抽出法を経由して、有効な予測変数の探索法を構築できることを明らかにすることと、スパース正則化法を利用したリスク因子剪定法が効率的かつ実用的な変数減少法を与えることを明らかにするのが、本研究の目的である。
平成26年度は、課題として掲げていた「スパース正則化を利用した自動変数グルーピング法の数値的側面の研究」に関して、実例ベースで研究を進めた。具体的には、電話による直接顧客マーケティングを利用した定期預金の販売に関するデータを分析した。預金契約に至りやすい顧客の特徴の把握と予測性が、変数選択法ないしグルーピング法によってどう異なるかを統計的に検証した。比較の対象として、LASSO、Elastic-Net、SCAD、MCPに加えて、我々の提案するSmooth-Threshold Estimating Equation法(STEE法)を取り上げた。推定用データと予測検証用データに分ける分割をランダムに10回実行して、受信者操作特性(ROC)曲線下の面積(AUC)で予測精度を比較すると、どの手法の精度もほぼ同等であった。この結果は国内学会の特別講演と、国際会議の招待講演で公表したほか、英文学術誌に投稿中で、現在改訂中である。
このほか、遺伝子間相互作用解析において分割表がスパースとなるケースに関し、一般的な固定自由度の代わりに適応的自由度を用いる検定手法を考案した。数値実験を行い、実際に検出力が向上することを確認し、得られた成果を論文にまとめて出版した。また、多変量金融時系列に基づく市場リスク管理への政策的な応用として、外国為替市場への介入額の意思決定システムを分析した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成26年度は、統計的パターン認識、機械学習における他手法との比較実証分析を、特に実際問題への応用の中で研究することを目標としていたが、これは銀行定期預金に関するテレマーケティングデータを利用した研究において、ほぼ達成することができた。研究内容は英文学術誌に投稿され、査読を経て現在改訂中である。また、遺伝子間相互作用解析においても着実に応用成果が上がっている。スパース正則化法に関連する学会発表では、研究代表者と研究分担者で合わせて5件の招待講演ないし特別講演(うち国際会議3件、国内学会2件)を行っており、学会での注目度は高まっている。
年度当初に挙げていた目標のうち、リスク最小化モデルとスパース正則化型変数選択法との統合は、研究分担者の一人の本務多忙で次年度に持ち越しとなったが、そもそも収損益データ(リスク事象のインパクト)が利用可能なデータで、結果を公表可能なケースは非常にすくなく、適切な公開データの取得に至らなかったという現実問題があった。これに関しては、シミュレーションデータでの検証を行うことを検討している。

今後の研究の推進方策

平成27年度は課題の最終年度であるので、本プロジェクトの研究成果を論文等刊行物の形でなるべく結実させるよう努める。H26年度から持ち越しとなった、リスク最小化モデルとスパース正則化型変数選択法との統合については、収損益データが利用可能なデータセットの取得に至らない場合は早めに判断し、シミュレーションベースでの検証に切り替える。
統計的パターン認識、機械学習における他手法との比較実証分析という点では、パラメータ空間における八角形型(octagonal)縮小制約という興味深いスパース正則化法があるので、これも実証分析に加えることを計画している。

次年度使用額が生じた理由

生じた次年度使用額の殆どは、初年度の平成25年度に研究分担者の一人が本務多忙であって、研究課題への取り組みは行ったが、学会発表等が本務都合でできなかったことに起因している。平成26年度単年度を取ってみれば、140万円の配分に対して147万円の執行であり、適正な執行状況にある。

次年度使用額の使用計画

初年度繰り越した分を考慮に入れて、研究発表や国際学会参加予定などに関して研究分担者と既に検討を行った上で配分額を調整しており、平成27年度の各機関への配分段階で、適切な配分となる予定である。

  • 研究成果

    (7件)

すべて 2015 2014

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (5件) (うち招待講演 5件) 図書 (1件)

  • [雑誌論文] On the choice of degrees of freedom for testing gene-gene interactions2014

    • 著者名/発表者名
      Ueki, M.
    • 雑誌名

      Statistics in Medicine

      巻: 33 ページ: 4934-4948

    • DOI

      10.1002/sim.6264

    • 査読あり / 謝辞記載あり
  • [学会発表] 円滑閾値型推定方程式によるリスク因子の探索法とその応用2015

    • 著者名/発表者名
      川崎能典
    • 学会等名
      応用統計学会2015年度年会
    • 発表場所
      京都大学芝蘭会館稲森ホール、京都市
    • 年月日
      2015-03-14 – 2015-03-14
    • 招待講演
  • [学会発表] Choosing multiple good regression models under multicollinearity2014

    • 著者名/発表者名
      Ueki, M., Kawasaki, Y.
    • 学会等名
      International Statistical Symposium CSA-KSS-JSS Special Invited Sessions
    • 発表場所
      National Chiao Tung University, Taipei, Taiwan
    • 年月日
      2014-12-06 – 2014-12-06
    • 招待講演
  • [学会発表] Predictive modeling in socio-economic data using smooth-thresholding2014

    • 著者名/発表者名
      Kawasaki, Y.
    • 学会等名
      International Conference on Statistical Analysis of Large Scale High Dimensional Socio-Economic Data
    • 発表場所
      Tohoku University, Sendai
    • 年月日
      2014-11-06 – 2014-11-07
    • 招待講演
  • [学会発表] ゲノムワイド疾患関連解析における統計的諸問題2014

    • 著者名/発表者名
      植木優夫
    • 学会等名
      第13回久留米大学バイオ統計学フォーラム
    • 発表場所
      JR博多シティ、福岡市
    • 年月日
      2014-09-26 – 2014-09-26
    • 招待講演
  • [学会発表] Ultrahigh-dimensional variable selection for genome-wide SNP-SNP2014

    • 著者名/発表者名
      Ueki, M., Tamiya, G.
    • 学会等名
      The 3rd Institute of Mathematical Statistics Asia Pacific Rim Meeting
    • 発表場所
      Howard International House, Taipei, Taiwan
    • 年月日
      2014-06-29 – 2014-07-03
    • 招待講演
  • [図書] ゲノム医学のための遺伝統計学2015

    • 著者名/発表者名
      田宮元、植木優夫、小森理
    • 総ページ数
      264
    • 出版者
      共立出版

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi