• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

ゲノムデータからの予測・発見・推論の統合化のための統計学と機械学習の融合

Research Project

Project/Area Number 20240028
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

江口 真透  The Institute of Statistical Mathematics, 数理・推論研究系, 教授 (10168776)

Co-Investigator(Kenkyū-buntansha) 栗木 哲  統計数理研究所, 数理・推論研究系, 教授 (90195545)
藤澤 洋徳  統計数理研究所, 数理・推論研究系, 准教授 (00301177)
逸見 昌之  統計数理研究所, 数理・推論研究系, 助教 (80465921)
松浦 正明  (財)癌研究会, ゲノムセンター情報解析部門, 部門長 (40173794)
KeywordsROC曲線 / マイクロアレイ / ブースティング / 効果予測 / 予測スコア / AUC
Research Abstract

ゲノムデータからの予測・発見・推論の統合化のための統計学と機械学習の融合を推進するために特に次の点について焦点を当てた。
[1]ゲノムデータに基づく表現系の予測スコアーを構成するために更に考察を加え、実用化に向けて幾つかの検討をした。特にROC(Receiver Operational Characteristic)曲線の下側面積の最大化について改良を加えた。これは医療の現場では擬陽性確率を一定の低い値にして正陽性確率をできるだけ高くする予測が広く受け入れられていることを勘案して,特に擬陽性確率が低い値より小さな領域に対応するROC曲線の下側面積の最大化について新たな機械学習の方法論を提案したものである。これは昨年、江口、小森によって開発されたAUC-Boostの改良版としてpAUC-Boostとして提案されている。また、マイクロアレイによる遺伝子発現による予測問題に対して古典的な2標本検定による変数選択の問題に対して考察した。この問題に対して遺伝子選択から予測まで、一貫してt検定を使うことを検討している。そのためにt検定量をブースティングの観点から見直し、新たにt-Boostを発表した。
[2]これらの統計的な方法論の開発を通して、一昨年より開始されている国立がんセンターの田村グループと乳がん治療の効果予測のための共同研究が推進された。特に、暫定的に決まっている複数の予測モデルに対して上で開発した方法も加えて検討を加えた。これらの中から最も実用性の高いモデルを近々に得られる検証用のデータによって決定するプロジェクトが順調に進められている。
[3]松浦研チームは予測問題について異なる観点から研究を進めている。これは予測の性能を図るための検証エラーレイトの信頼性について徹底的な検討・考察をしたもので、その結果、多くの場合、表現系の中に複合的なサブクラスが内在することが示唆され、このクラス内の異型性が予測の信頼度を低下させていることを結論付けた。この研究は上記の[1]、[2]とともに密接に関連する問題であるので来年度はこの知見をさらなる考察から強めたい。

  • Research Products

    (20 results)

All 2010 2009

All Journal Article (8 results) (of which Peer Reviewed: 8 results) Presentation (12 results)

  • [Journal Article] Likelihood for statistically equivalent models.2010

    • Author(s)
      Copas, J., Eguchi, S.
    • Journal Title

      J.Royal Statistical Society B 72

      Pages: 193-217

    • Peer Reviewed
  • [Journal Article] Robust extraction of local structures by the minimum beta-divergence Method2010

    • Author(s)
      Mollah, N.H., Minami, M., Eguchi, S.
    • Journal Title

      Neural Networks 23

      Pages: 226-23

    • Peer Reviewed
  • [Journal Article] Maximum regularized likelihood estimation of finite mixtures with a structural model.2010

    • Author(s)
      Eguchi, S., Yoshioka, K.
    • Journal Title

      Communications in Statistics (To appear)

    • Peer Reviewed
  • [Journal Article] Entropy and divergence associated with power function and the statistical application.2010

    • Author(s)
      Eguchi, S., Kato, S.
    • Journal Title

      Entropy 12

      Pages: 262-274

    • Peer Reviewed
  • [Journal Article] Robust kernel principal component analysis2009

    • Author(s)
      Huang, S-Y., Yeh, Y-R., Eguchi, S.
    • Journal Title

      Neural Computation 21

      Pages: 3179-3213

    • Peer Reviewed
  • [Journal Article] SNEP : Simultaneous detection of nucleotide and expression polymorphisms using Affymetrix GeneChip2009

    • Author(s)
      Fujisawa, H., Horiuchi, Y., Harushima, Y., Takada, T., Eguchi, S., Mochizuki, T., Sakaguchi, T., Shiroishi, T., Kurata, N.
    • Journal Title

      BMC Bioinformatics 10:131.

    • Peer Reviewed
  • [Journal Article] 関連遺伝子セットの多重解の存在.2009

    • Author(s)
      プリチャード真理, 江口真透
    • Journal Title

      日本統計学会誌(シリーズJ 2号) 38

      Pages: 199-212

    • Peer Reviewed
  • [Journal Article] Robust hierarchical clustering for gene expression data analysis.2009

    • Author(s)
      N.H.Mollah, M.Pritchard, O.Komori, S.Eguchi.
    • Journal Title

      Communications of SIWN 6

      Pages: 118-122

    • Peer Reviewed
  • [Presentation] t-Boost method for discriminant analysis with high-dimensional feature vector.2009

    • Author(s)
      江口真透、小森理
    • Organizer
      科学研究費集会「高次元データの統計学-理論・方法論・関連分野への応用-」
    • Place of Presentation
      筑波大学
    • Year and Date
      2009-12-14
  • [Presentation] Robust QTL analysis by minimum beta-divergence method.(Invited talk)2009

    • Author(s)
      Mollah, N.H., Eguchi, S.
    • Organizer
      TRIC Symposium "Statistical and Systems Genetics"
    • Place of Presentation
      Mishima, Japan
    • Year and Date
      2009-10-22
  • [Presentation] AUCを用いた格付予測評価指標と重み付き最適化2009

    • Author(s)
      三浦翔, 山下智志, 江口真透
    • Organizer
      統計関連学会連合大会
    • Place of Presentation
      京都, 日本
    • Year and Date
      2009-09-07
  • [Presentation] t値を最大にする判別関数のブースティング2009

    • Author(s)
      江口真透, 小森理
    • Organizer
      統計関連学会連合大会
    • Place of Presentation
      京都, 日本
    • Year and Date
      2009-09-07
  • [Presentation] 3次自然スプラインに基づくpAUCBoost2009

    • Author(s)
      小森理, 江口真透
    • Organizer
      統計関連学会連合大会
    • Place of Presentation
      京都, 日本
    • Year and Date
      2009-09-06
  • [Presentation] Maximizing t-values for all functions of a feature vector.(Invited)2009

    • Author(s)
      Eguchi, S
    • Organizer
      Workshop on Geometric and Algebraic Statistics
    • Place of Presentation
      Milton Keynes, U.K.
    • Year and Date
      2009-07-13
  • [Presentation] Projective Tsallis Entropy and its Application to Robust Statistics.(Invited talk)2009

    • Author(s)
      Eguchi, S.
    • Organizer
      Mathematical Aspects of Generalized Entropies and their Applications.
    • Place of Presentation
      Kyoto, Japan
    • Year and Date
      2009-07-08
  • [Presentation] Boosting true positive and false positive rates for pattern recognition(Invited)2009

    • Author(s)
      Eguchi, S
    • Organizer
      Institute of Mathematical Statistics Asia Pacific Rim 1st Meeting
    • Place of Presentation
      Seoul, South Korea
    • Year and Date
      2009-06-29
  • [Presentation] Sparse weak learner boosting for high-dimensional data.(Poster)2009

    • Author(s)
      Pritchard, M., Eguchi, S.
    • Organizer
      Institute of Mathematical statistics Asia Pacific Rim 1st Meeting
    • Place of Presentation
      Seoul, South Korea
    • Year and Date
      2009-06-28
  • [Presentation] AUC maximization in credit scoring.(Poster)2009

    • Author(s)
      Miura, K., Satoshi, Y., Eguchi, S.
    • Organizer
      Institute of Mathematical statistics Asia Pacific Rim 1st Meeting
    • Place of Presentation
      Seoul, South Korea
    • Year and Date
      2009-06-28
  • [Presentation] Maximization of the partial area under the ROC curve using a boosting technique.(Poster)2009

    • Author(s)
      Komori, O., Eguchi, S.
    • Organizer
      Institute of Mathematical Statistics Asia Pacific Rim 1st Meeting
    • Place of Presentation
      Seoul, South Korea
    • Year and Date
      2009-06-28
  • [Presentation] Information divergence geometry and its application to machine learning(Invited)2009

    • Author(s)
      Eguchi, S.
    • Organizer
      The Fifth Statistics and Machine Learning Workshop
    • Place of Presentation
      Tainan, Taiwan
    • Year and Date
      2009-04-28

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi