• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

スパース正則化による判別とグループ化に基づく意思決定システムの構築

Research Project

Project/Area Number 25330049
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

川崎 能典  統計数理研究所, 大学共同利用機関等の部局等, 准教授 (70249910)

Co-Investigator(Kenkyū-buntansha) 植木 優夫  東北大学, 学内共同利用施設等, 助教 (10515860)
赤司 健太郎  学習院大学, 経済学部, 准教授 (50610747)
Project Period (FY) 2013-04-01 – 2016-03-31
Keywordsスパース正則化法 / 分類・パターン認識 / 変数選択 / 変数グルーピング / 高次元分割表解析 / リスク解析 / 多重共線性
Outline of Annual Research Achievements

カテゴリカルな応答変数に対して説明変数候補が膨大で、交互作用項が組合せ爆発的に多い状況を考える。このようなデータセットに対し、高次元分割表解析による情報抽出法を経由して、有効な予測変数の探索法を構築できることを明らかにすることと、スパース正則化法を利用したリスク因子剪定法が効率的かつ実用的な変数減少法を与えることを明らかにするのが、本研究の目的である。
平成26年度は、課題として掲げていた「スパース正則化を利用した自動変数グルーピング法の数値的側面の研究」に関して、実例ベースで研究を進めた。具体的には、電話による直接顧客マーケティングを利用した定期預金の販売に関するデータを分析した。預金契約に至りやすい顧客の特徴の把握と予測性が、変数選択法ないしグルーピング法によってどう異なるかを統計的に検証した。比較の対象として、LASSO、Elastic-Net、SCAD、MCPに加えて、我々の提案するSmooth-Threshold Estimating Equation法(STEE法)を取り上げた。推定用データと予測検証用データに分ける分割をランダムに10回実行して、受信者操作特性(ROC)曲線下の面積(AUC)で予測精度を比較すると、どの手法の精度もほぼ同等であった。この結果は国内学会の特別講演と、国際会議の招待講演で公表したほか、英文学術誌に投稿中で、現在改訂中である。
このほか、遺伝子間相互作用解析において分割表がスパースとなるケースに関し、一般的な固定自由度の代わりに適応的自由度を用いる検定手法を考案した。数値実験を行い、実際に検出力が向上することを確認し、得られた成果を論文にまとめて出版した。また、多変量金融時系列に基づく市場リスク管理への政策的な応用として、外国為替市場への介入額の意思決定システムを分析した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

平成26年度は、統計的パターン認識、機械学習における他手法との比較実証分析を、特に実際問題への応用の中で研究することを目標としていたが、これは銀行定期預金に関するテレマーケティングデータを利用した研究において、ほぼ達成することができた。研究内容は英文学術誌に投稿され、査読を経て現在改訂中である。また、遺伝子間相互作用解析においても着実に応用成果が上がっている。スパース正則化法に関連する学会発表では、研究代表者と研究分担者で合わせて5件の招待講演ないし特別講演(うち国際会議3件、国内学会2件)を行っており、学会での注目度は高まっている。
年度当初に挙げていた目標のうち、リスク最小化モデルとスパース正則化型変数選択法との統合は、研究分担者の一人の本務多忙で次年度に持ち越しとなったが、そもそも収損益データ(リスク事象のインパクト)が利用可能なデータで、結果を公表可能なケースは非常にすくなく、適切な公開データの取得に至らなかったという現実問題があった。これに関しては、シミュレーションデータでの検証を行うことを検討している。

Strategy for Future Research Activity

平成27年度は課題の最終年度であるので、本プロジェクトの研究成果を論文等刊行物の形でなるべく結実させるよう努める。H26年度から持ち越しとなった、リスク最小化モデルとスパース正則化型変数選択法との統合については、収損益データが利用可能なデータセットの取得に至らない場合は早めに判断し、シミュレーションベースでの検証に切り替える。
統計的パターン認識、機械学習における他手法との比較実証分析という点では、パラメータ空間における八角形型(octagonal)縮小制約という興味深いスパース正則化法があるので、これも実証分析に加えることを計画している。

Causes of Carryover

生じた次年度使用額の殆どは、初年度の平成25年度に研究分担者の一人が本務多忙であって、研究課題への取り組みは行ったが、学会発表等が本務都合でできなかったことに起因している。平成26年度単年度を取ってみれば、140万円の配分に対して147万円の執行であり、適正な執行状況にある。

Expenditure Plan for Carryover Budget

初年度繰り越した分を考慮に入れて、研究発表や国際学会参加予定などに関して研究分担者と既に検討を行った上で配分額を調整しており、平成27年度の各機関への配分段階で、適切な配分となる予定である。

  • Research Products

    (7 results)

All 2015 2014

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Acknowledgement Compliant: 1 results) Presentation (5 results) (of which Invited: 5 results) Book (1 results)

  • [Journal Article] On the choice of degrees of freedom for testing gene-gene interactions2014

    • Author(s)
      Ueki, M.
    • Journal Title

      Statistics in Medicine

      Volume: 33 Pages: 4934-4948

    • DOI

      10.1002/sim.6264

    • Peer Reviewed / Acknowledgement Compliant
  • [Presentation] 円滑閾値型推定方程式によるリスク因子の探索法とその応用2015

    • Author(s)
      川崎能典
    • Organizer
      応用統計学会2015年度年会
    • Place of Presentation
      京都大学芝蘭会館稲森ホール、京都市
    • Year and Date
      2015-03-14 – 2015-03-14
    • Invited
  • [Presentation] Choosing multiple good regression models under multicollinearity2014

    • Author(s)
      Ueki, M., Kawasaki, Y.
    • Organizer
      International Statistical Symposium CSA-KSS-JSS Special Invited Sessions
    • Place of Presentation
      National Chiao Tung University, Taipei, Taiwan
    • Year and Date
      2014-12-06 – 2014-12-06
    • Invited
  • [Presentation] Predictive modeling in socio-economic data using smooth-thresholding2014

    • Author(s)
      Kawasaki, Y.
    • Organizer
      International Conference on Statistical Analysis of Large Scale High Dimensional Socio-Economic Data
    • Place of Presentation
      Tohoku University, Sendai
    • Year and Date
      2014-11-06 – 2014-11-07
    • Invited
  • [Presentation] ゲノムワイド疾患関連解析における統計的諸問題2014

    • Author(s)
      植木優夫
    • Organizer
      第13回久留米大学バイオ統計学フォーラム
    • Place of Presentation
      JR博多シティ、福岡市
    • Year and Date
      2014-09-26 – 2014-09-26
    • Invited
  • [Presentation] Ultrahigh-dimensional variable selection for genome-wide SNP-SNP2014

    • Author(s)
      Ueki, M., Tamiya, G.
    • Organizer
      The 3rd Institute of Mathematical Statistics Asia Pacific Rim Meeting
    • Place of Presentation
      Howard International House, Taipei, Taiwan
    • Year and Date
      2014-06-29 – 2014-07-03
    • Invited
  • [Book] ゲノム医学のための遺伝統計学2015

    • Author(s)
      田宮元、植木優夫、小森理
    • Total Pages
      264
    • Publisher
      共立出版

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi