• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

ゲノムデータからの予測・発見・推論の統合化のための統計学と機械学習の融合

Research Project

Project/Area Number 20240028
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

江口 真透  統計数理研究所, 数理・推論研究系, 教授 (10168776)

Co-Investigator(Kenkyū-buntansha) 藤澤 洋徳  統計数理研究所, 数理・推論研究系, 准教授 (00301177)
間野 修平  統計数理研究所, 数理・推論研究系, 准教授 (20372948)
逸見 昌之  統計数理研究所, 数理・推論研究系, 准教授 (80465921)
小森 理  統計数理研究所, 数理・推論研究系, 助教 (60586379)
松浦 正明  (財)がん研究会, ゲノムセンター・情報解析部門, 部門長 (40173794)
Keywordsゲノムデータ / 予測 / 機械学習 / パタン認識 / 高次元
Research Abstract

今年度は以下のように研究発表と情報交換を行い、課題についての研究が遂行された.
A.平成23年12月に台北のAcademia SinicaとNational Taiwan Universityを訪問した.特にHung Chen教授,Hung Hung助教,Su-Yun Huang博士,Yuan-chin Chen博士と機械学習と統計学の融合的発展のために大学院生の教育も含めて研究交流を行い,そこで開催された国際会議と研究会に発表・参加した.
B.情報幾何の立場から教師なし学習のためのブースティング法やクラスタリング法の開発を行い,従来の方法を改良してバイオインフォマティクスに使える性能を持たせることに成功した.一般化エントロピーのクラスの中でベキエントロピーがクラスター数を適切に見出すことが分かってきているので,これについて平成24年3月にあった奈良の国際会議で発表した.
C.平成24年1月に長年に渡る共同研究を遂行しているUniversity of WarwickのJohn Copas教授の所を訪問した.今年度の主要な目的である「予測モデルの発見と再現性の強化」のために探索と検証をつなぐための研究を行った.RISKUセンターのセミナーでの招待講演を行った.
また具体的な研究テーマは次のように進行した.
1.国立がんセンターの田村グループとの共同研究:遺伝子発現による乳がん治療の効果予測ついて研究について最終的なまとめができた.
2.三菱化学科学技術研究センター・バイオ技術研究所との共同研究では脳梗塞を表現形とするパタン認識において変数選択の際に起こる過剰学習を改良する方法を昨年度開発したが,特に病型予測の問題について実用化が進行した.
3.教師なし学習のための機械学習の方法を目指す.特にクラスタリングのための新手法の開発とブースティング方法による密度関数や回帰関数の新手法を提案し,ゲノム・オミクスデータに適用する.クラスリングではクラスター数を自動的に判定できる方法について開発した.現在は変数選択のできるバージョンについて引き続き開発している.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

機械学習の手法を高度に援用してゲノム・オミクスデータの情報から表現形予測の開発プロジェクトの中で,特に再現性の問題について考えた.再現性を悪化していた原因として臨床的な背景の異質性があることが分かった.これについてサブタイプの特定をすることによって異質性の分類が教師なし学習の内容で可能になった.

Strategy for Future Research Activity

今後,機械学習の手法を援用したゲノム・オミクスデータに基づく表現形予測の開発プロジェクトを上記の再現性の問題点の解明から予測性能の再現性を高める方法論の開発に重点を移すことする.

  • Research Products

    (14 results)

All 2012 2011 Other

All Journal Article (4 results) (of which Peer Reviewed: 3 results) Presentation (8 results) Book (1 results) Remarks (1 results)

  • [Journal Article] Boosting learning algorithm for pattern recognition and beyond2011

    • Author(s)
      O. Komori and S. Eguchi
    • Journal Title

      E94-D

      Volume: 10 Pages: 1863-1869

    • DOI

      DOI 10.1587/transinf.E94.D.1863

    • Peer Reviewed
  • [Journal Article] Projective power entropy and maximum Tsallis entropy distributions2011

    • Author(s)
      S. Eguchi, O. Komori and S. Kato
    • Journal Title

      Entropy

      Volume: 13 Pages: 1746-1764

    • DOI

      DOI 10.3390/e13101746

    • Peer Reviewed
  • [Journal Article] ゲノム・プロテオミクスデータを用いた予測解析:機械学習による新しい統計的手法2011

    • Author(s)
      小森理, 江口真透
    • Journal Title

      計量生物学

      Volume: 32 Pages: 49-73

    • DOI

      10.5691/jjb.32.49

    • Peer Reviewed
  • [Journal Article] Invited discussion on Riemann manifold Langevin and Hamiltonian Monte Carlo methods' by M.Girolami, B.Calderhead2011

    • Author(s)
      S.Eguchi
    • Journal Title

      J Royal Statistical Society B

      Volume: 73 Pages: 180-181

    • DOI

      10.1111/j.1467-9868.2010.00765.x

  • [Presentation] Projective power cross entropy and detectability for hidden structures2012

    • Author(s)
      S.Eguchi, A.Notsu, O.Komor
    • Organizer
      International Workshop on Anomalous Statisties, Generalized Entropies, and Information Geometry
    • Place of Presentation
      奈良女子大学(招待講演)
    • Year and Date
      20120300
  • [Presentation] Maximization of a generalized t statistic for linear discrimination in the two group classification problem2012

    • Author(s)
      S.Eguchi
    • Organizer
      Centre for Research in Statistical Methodology
    • Place of Presentation
      University of Warwickイギリス(招待講演)
    • Year and Date
      20120100
  • [Presentation] Emergent estimation for means and variances towards local leaning for data structure2012

    • Author(s)
      江口真透
    • Organizer
      ISM-ISI-ISSAS Joint Conference 2012
    • Place of Presentation
      統計数理研究所
    • Year and Date
      2012-02-02
  • [Presentation] Projective power entropy based learning for unsupervised data2011

    • Author(s)
      S.Eguchi, O.Komori, A.Notsu
    • Organizer
      Joint Meeting of 2011 Taipei International Statistical Symposium
    • Place of Presentation
      Academia Sinica, Taiawan(招待講演)
    • Year and Date
      2011-12-17
  • [Presentation] エマージェント・クラスター分析2011

    • Author(s)
      江口真透
    • Organizer
      2011年度統計学会
    • Place of Presentation
      九州大学
    • Year and Date
      2011-09-06
  • [Presentation] t統計量をもとにしたLassoとBoostingについて2011

    • Author(s)
      小森理
    • Organizer
      2011年度統計学会
    • Place of Presentation
      九州大学
    • Year and Date
      2011-09-06
  • [Presentation] Projective entropy and maximum Tsallis entropy distributions2011

    • Author(s)
      S.Eguchi
    • Organizer
      Workshop on Information Geometry
    • Place of Presentation
      Riken Institute(招待講演)
    • Year and Date
      2011-08-31
  • [Presentation] Maximization of t-Statistics based on one class label2011

    • Author(s)
      O.Komori, S.Eguchi
    • Organizer
      Young Statisticians Meeting
    • Place of Presentation
      Trinity College Dublin,アイルランド
    • Year and Date
      2011-08-20
  • [Book] 科学者の本棚-『鉄腕アトム』から『ユークリッド原論』まで--「日本発情報幾何の礎」甘利俊一「Differential Geometrical Methods in Statistics」(統計学の微分幾何の方法)2011

    • Author(s)
      江口真透
    • Total Pages
      256
    • Publisher
      岩波書店
  • [Remarks]

    • URL

      http://www.ism.ac.jp/~eguchi/

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi