• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

情報統合のためのアンサンブル学習アルゴリズムの開発と解析

Research Project

Project/Area Number 21700304
Research InstitutionNara Institute of Science and Technology

Principal Investigator

竹之内 高志  Nara Institute of Science and Technology, 情報科学研究科, 助教 (50403340)

Keywordsアンサンブル学習 / 判別分析 / ブートストラップ / ブースティング
Research Abstract

今年度はアンサンブル学習の枠組みで,ROCカーブ最適化のためのブースティング法,バイオインフォマティクスデータに対して有効な判別法,行列因子化法の考案を行った.
・ 2値ラベルにおいて順序が付与されているデータではROCカーブの下側面積(AUC)が判別器評価の指標として用いられる.従来,AUCの最適化は非凸な問題であるため直接最適化することは難しかったが,適切な近似コスト関数を考案することで,AUCを最大化する判別器を直接構成するための手法を提案した.また,提案アルゴリズムの統計的性質などを議論し,外れ値に影響を受けにくいロバストなコスト関数を考案した.
・ 病理診断システムなどに用いられるバイオインフォマティクスデータは例題数が入力の次元(遺伝子数)に比べて著しく少ない.このようなデータに対して,判別に有効な遺伝子を選択することは重要な問題であるが,従来の選択法では,例題数の少なさとデータに含まれるノイズの影響により,信頼性の高い選択を行うことができなかった.この問題に対し,ブートストラップ法を用いて性能の最悪評価を行うことで信頼性の高い遺伝子数選択,判別器を構成するための手法を提案し,人工データ,実データでその有効性を確かめた.
・ アイテムに対して複数のユーザーが評価を行ったデータを元に推薦を行うシステムにおいて基幹技術として用いられている行列(テンソル)因子化法に対して,2つの拡張を行った.(1) ユーザーの嗜好を反映するようなグループが存在するデータを対象として,混合モデルを用いて拡張を行い,その有効性を大規模な実データで示した.(2) データの各変量が異なる素性を持つような場合を対象として,指数型分布族を用いた拡張を行い,効率的な最適化を行うための近似法を提案した.実データを用いて提案法と従来手法と比較し,提案法が精度の高い予測性能を発揮することを確認した.

  • Research Products

    (12 results)

All 2010 2009

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (9 results) Book (1 results)

  • [Journal Article] A multi-class classification method based on decoding of binary classifiers.2009

    • Author(s)
      T.Takenouchi.
    • Journal Title

      Neural Computation 21(7)

      Pages: 2049-2081

    • Peer Reviewed
  • [Journal Article] Robust model selection for classification of microarrays.2009

    • Author(s)
      I.Suzuki.
    • Journal Title

      Cancer Informatics 7

      Pages: 141-157

    • Peer Reviewed
  • [Presentation] Exponential Family Tensor Factorization for Missing Values Prediction and Anomaly Detection2010

    • Author(s)
      林浩平
    • Organizer
      第12回DMSM研究会
    • Place of Presentation
      統計数理研究所
    • Year and Date
      2010-03-30
  • [Presentation] Subsurface imaging by Bayesian super-resolution for anti-personal mine detection using ground penetrating radar.2010

    • Author(s)
      S.Kozawa
    • Organizer
      International Workshop on Nonlinear Circuits, Communications and Signal Processing
    • Place of Presentation
      Hawaii, USA
    • Year and Date
      2010-03-04
  • [Presentation] 各要素が混合ガウス分布に従う行列に対する行列因子化による欠損値予測2010

    • Author(s)
      中村政義
    • Organizer
      電子情報通信学会技術研究報告NC
    • Place of Presentation
      北海道大学
    • Year and Date
      2010-01-19
  • [Presentation] 経験尤度を用いた統計量推定法とその性質2010

    • Author(s)
      武田学
    • Organizer
      電子情報通信学会技術研究報告NC
    • Place of Presentation
      北海道大学
    • Year and Date
      2010-01-19
  • [Presentation] 各要素が混合ガウス分布に従う行列に対する行列因子化による欠損値予測2009

    • Author(s)
      中村政義
    • Organizer
      第12回情報論的学習理論ワークショップ(IBIS 2009).
    • Place of Presentation
      九州大学
    • Year and Date
      2009-10-20
  • [Presentation] Sparse Exponential Family PCA with Heterogeneous Attributes.2009

    • Author(s)
      林浩平
    • Organizer
      第12回情報論的学習理論ワークショップ(IBIS 2009).
    • Place of Presentation
      九州大学
    • Year and Date
      2009-10-20
  • [Presentation] A multi-class classification by ECOC ensemble and its extension2009

    • Author(s)
      Takashi Takenouchi
    • Organizer
      2009年度統計関連学会連合大会
    • Place of Presentation
      同志社大学
    • Year and Date
      2009-09-07
  • [Presentation] Extension of ROC curve.2009

    • Author(s)
      T.Takeriouchi
    • Organizer
      IEEE International Workshop on Machine Learning For Signal Processing
    • Place of Presentation
      Grenoble, France
    • Year and Date
      2009-09-04
  • [Presentation] Robust classification with mislabeling model.2009

    • Author(s)
      T.Takenouchi
    • Organizer
      Mathematical Aspects of Generalized Entropies and their Applications
    • Place of Presentation
      Kyoto, Japan
    • Year and Date
      2009-07-08
  • [Book] パターン認識(Rで学ぶデータサイエンス5)2009

    • Author(s)
      金森敬文
    • Total Pages
      288
    • Publisher
      共立出版株式会社

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi