• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

情報統合のためのアンサンブル学習アルゴリズムの開発と解析

研究課題

研究課題/領域番号 21700304
研究機関奈良先端科学技術大学院大学

研究代表者

竹之内 高志  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (50403340)

キーワードアンサンブル学習 / 判別分析 / ブートストラップ / ブースティング
研究概要

今年度はアンサンブル学習の枠組みで,ROCカーブ最適化のためのブースティング法,バイオインフォマティクスデータに対して有効な判別法,行列因子化法の考案を行った.
・ 2値ラベルにおいて順序が付与されているデータではROCカーブの下側面積(AUC)が判別器評価の指標として用いられる.従来,AUCの最適化は非凸な問題であるため直接最適化することは難しかったが,適切な近似コスト関数を考案することで,AUCを最大化する判別器を直接構成するための手法を提案した.また,提案アルゴリズムの統計的性質などを議論し,外れ値に影響を受けにくいロバストなコスト関数を考案した.
・ 病理診断システムなどに用いられるバイオインフォマティクスデータは例題数が入力の次元(遺伝子数)に比べて著しく少ない.このようなデータに対して,判別に有効な遺伝子を選択することは重要な問題であるが,従来の選択法では,例題数の少なさとデータに含まれるノイズの影響により,信頼性の高い選択を行うことができなかった.この問題に対し,ブートストラップ法を用いて性能の最悪評価を行うことで信頼性の高い遺伝子数選択,判別器を構成するための手法を提案し,人工データ,実データでその有効性を確かめた.
・ アイテムに対して複数のユーザーが評価を行ったデータを元に推薦を行うシステムにおいて基幹技術として用いられている行列(テンソル)因子化法に対して,2つの拡張を行った.(1) ユーザーの嗜好を反映するようなグループが存在するデータを対象として,混合モデルを用いて拡張を行い,その有効性を大規模な実データで示した.(2) データの各変量が異なる素性を持つような場合を対象として,指数型分布族を用いた拡張を行い,効率的な最適化を行うための近似法を提案した.実データを用いて提案法と従来手法と比較し,提案法が精度の高い予測性能を発揮することを確認した.

  • 研究成果

    (12件)

すべて 2010 2009

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (9件) 図書 (1件)

  • [雑誌論文] A multi-class classification method based on decoding of binary classifiers.2009

    • 著者名/発表者名
      T.Takenouchi.
    • 雑誌名

      Neural Computation 21(7)

      ページ: 2049-2081

    • 査読あり
  • [雑誌論文] Robust model selection for classification of microarrays.2009

    • 著者名/発表者名
      I.Suzuki.
    • 雑誌名

      Cancer Informatics 7

      ページ: 141-157

    • 査読あり
  • [学会発表] Exponential Family Tensor Factorization for Missing Values Prediction and Anomaly Detection2010

    • 著者名/発表者名
      林浩平
    • 学会等名
      第12回DMSM研究会
    • 発表場所
      統計数理研究所
    • 年月日
      2010-03-30
  • [学会発表] Subsurface imaging by Bayesian super-resolution for anti-personal mine detection using ground penetrating radar.2010

    • 著者名/発表者名
      S.Kozawa
    • 学会等名
      International Workshop on Nonlinear Circuits, Communications and Signal Processing
    • 発表場所
      Hawaii, USA
    • 年月日
      2010-03-04
  • [学会発表] 各要素が混合ガウス分布に従う行列に対する行列因子化による欠損値予測2010

    • 著者名/発表者名
      中村政義
    • 学会等名
      電子情報通信学会技術研究報告NC
    • 発表場所
      北海道大学
    • 年月日
      2010-01-19
  • [学会発表] 経験尤度を用いた統計量推定法とその性質2010

    • 著者名/発表者名
      武田学
    • 学会等名
      電子情報通信学会技術研究報告NC
    • 発表場所
      北海道大学
    • 年月日
      2010-01-19
  • [学会発表] 各要素が混合ガウス分布に従う行列に対する行列因子化による欠損値予測2009

    • 著者名/発表者名
      中村政義
    • 学会等名
      第12回情報論的学習理論ワークショップ(IBIS 2009).
    • 発表場所
      九州大学
    • 年月日
      2009-10-20
  • [学会発表] Sparse Exponential Family PCA with Heterogeneous Attributes.2009

    • 著者名/発表者名
      林浩平
    • 学会等名
      第12回情報論的学習理論ワークショップ(IBIS 2009).
    • 発表場所
      九州大学
    • 年月日
      2009-10-20
  • [学会発表] A multi-class classification by ECOC ensemble and its extension2009

    • 著者名/発表者名
      Takashi Takenouchi
    • 学会等名
      2009年度統計関連学会連合大会
    • 発表場所
      同志社大学
    • 年月日
      2009-09-07
  • [学会発表] Extension of ROC curve.2009

    • 著者名/発表者名
      T.Takeriouchi
    • 学会等名
      IEEE International Workshop on Machine Learning For Signal Processing
    • 発表場所
      Grenoble, France
    • 年月日
      2009-09-04
  • [学会発表] Robust classification with mislabeling model.2009

    • 著者名/発表者名
      T.Takenouchi
    • 学会等名
      Mathematical Aspects of Generalized Entropies and their Applications
    • 発表場所
      Kyoto, Japan
    • 年月日
      2009-07-08
  • [図書] パターン認識(Rで学ぶデータサイエンス5)2009

    • 著者名/発表者名
      金森敬文
    • 総ページ数
      288
    • 出版者
      共立出版株式会社

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi