• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

数理計画法による特徴選択の厳密化

研究課題

研究課題/領域番号 26560165
研究機関東京農工大学

研究代表者

宮代 隆平  東京農工大学, 工学(系)研究科(研究院), 准教授 (50376860)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード特徴選択 / 数理工学 / アルゴリズム / 統計 / OR
研究実績の概要

平成27年度の研究においては,以下の課題の解明に努め,また下記に示す研究成果を得た.
当初の研究計画に記した通り,変数選択問題には本質的に数値的な不安定性を含むデータが存在する.データを解析した結果,これらはアルゴリズム中の内点法におけるSlater条件の違反によるものが大きいことが判明した.一方で,ある程度大規模であっても数値的に安定している問題データもあり,これらについては相関係数行列の条件数の大きさが関連していることが先行研究で指摘されていた.
これらのことから,条件数を一定以下に抑えた上で特徴選択を行う問題を考えることが必要になるが,本研究でこれを混合整数半正値計画問題に定式化することに成功した.先行研究においても類似の定式化は得られていたが,そこでは目的関数が2次の問題となっており,実際に計算機で解くのは困難だったのに対し,本研究では目的関数が線形の混合整数半正値計画問題としてモデル化が可能になり,計算機を用いた求解が可能になった.
また,中規模の特徴選択問題について,計算をより高速化するアイデアを考案し,実装を開始した.予備実験の結果,問題例にもよるが3倍程度の高速化が見込めると思われ,平成28年度の主要な研究として位置付ける.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成27年度の研究実施計画に照らし合わせ,「おおむね順調に進展している」と自己評価する.理由は以下に述べるとおりである.
平成27年度研究計画であげていた3つのポイントのうち,「数値不安定性の克服」については,目的関数が線形の混合整数半正定値計画問題としての定式化の開発に成功した.これは,先行研究で得られていた目的関数が2次の定式化より単純であり,通常の計算機で解くことのできる問題である.
また,「中規模データに対する厳密な回帰モデルの求解」については,既に計算を行い,従来のステップワイズ法より大幅に良い結果が得られる問題例が発見された.ステップワイズ法はある程度万能な手法と考えられていたが,そうでない問題例が存在されたことにより,本研究の目的である数理計画による特徴選択の有用性が示された形となった.
「数理計画法における探索ルールの構築」については,計算時間の高速化を目指して計画の一部としたが,研究実績の概要に記した通り,計算を3倍程度高速化するアイデアを考案し,実装を開始している.これは厳密には探索ルールの構築によって達成されたものではないが,研究の目的である特徴選択の厳密化および高速化に寄与するものである.

今後の研究の推進方策

平成27年度に考案した,計算の高速化のアイデアを実施すると共に,もともとの研究計画に含まれていた「大規模データに対する厳密な回帰モデルの求解」および「超大規模データに対する回帰モデルの高精度化」の研究を行う.特に,計算の高速化が,分枝限定法の初期段階で得られる解の質にどのような影響があるかを精査し,計算の高速化と計算の打ち切りについてのトレードオフについて吟味を行うこととする.特徴選択を実際に行う場合には,計算に制限時間が設けられていることが多く,大規模な問題の場合には,計算の高速化を行ったとしても制限時間内に解ききれないケースがある.この場合には,仮に総計算時間が遅くとも,計算の初期の段階で質の良い解を出力するアルゴリズムの方が望まれることになるため,超大規模問題に対しては計算の高速化だけではなく計算の初期段階での質についても注意する必要がある.
また,平成27年度に得られた目的関数が線形の混合整数半正値計画問題としてのモデルについて計算機実験を進め,数値的不安定性の解消をねらう.
さらに,得られた研究成果の論文発表及び学会発表を引き続き行う.

次年度使用額が生じた理由

参加した国際会議が日本での開催だったため,当初計画より旅費の執行が少なかったことによる.

次年度使用額の使用計画

当初購入を予定していなかった計算機を購入し,より一層のデータ解析の効率化を図ることとする.

  • 研究成果

    (4件)

すべて 2016 2015

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 1件) 学会発表 (2件)

  • [雑誌論文] Feature subset selection for logistic regression via mixed integer optimization2016

    • 著者名/発表者名
      T. Sato, Y. Takano, R. Miyashiro, A. Yoshise
    • 雑誌名

      Computational Optimization and Applications

      巻: 64 ページ: 865-880

    • DOI

      10.1007/s10589-016-9832-2

    • 査読あり
  • [雑誌論文] Mixed integer second-order cone programming formulations for variable selection2015

    • 著者名/発表者名
      Ryuhei Miyashiro, Yuichi Takano
    • 雑誌名

      European Journal of Operational Research

      巻: 247 ページ: 721-731

    • DOI

      10.1016/j.ejor.2015.06.081

    • 査読あり / 謝辞記載あり
  • [学会発表] 区分線形近似を用いた逐次ロジットモデルの変数選択2016

    • 著者名/発表者名
      佐藤俊樹,高野祐一,宮代隆平
    • 学会等名
      日本オペレーションズ・リサーチ学会 2016年春季研究発表会
    • 発表場所
      慶應義塾大学(神奈川県横浜市)
    • 年月日
      2016-03-17 – 2016-03-18
  • [学会発表] 区分線形近似を用いた逐次ロジットモデルの変数選択2016

    • 著者名/発表者名
      佐藤俊樹,高野祐一,宮代隆平
    • 学会等名
      情報処理学会 第78回全国大会
    • 発表場所
      慶應義塾大学(神奈川県横浜市)
    • 年月日
      2016-03-10 – 2016-03-12

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi