2012 Fiscal Year Annual Research Report
ゲノムデータからの予測・発見・推論の統合化のための統計学と機械学習の融合
Project/Area Number |
20240028
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
江口 真透 統計数理研究所, 大学共同利用機関等の部局等, 教授 (10168776)
|
Co-Investigator(Kenkyū-buntansha) |
藤澤 洋徳 統計数理研究所, 大学共同利用機関等の部局等, 准教授 (00301177)
間野 修平 統計数理研究所, 数理・推論研究系, 准教授 (20372948)
松浦 正明 公益財団法人がん研究会, その他部局等, 研究員 (40173794)
小森 理 統計数理研究所, その他部局等, その他 (60586379)
逸見 昌之 統計数理研究所, 大学共同利用機関等の部局等, 准教授 (80465921)
|
Project Period (FY) |
2008-04-08 – 2013-03-31
|
Keywords | 遺伝子発現 / 乳がんサブタイプ / ブースティング / クラスターリング / t-統計量 |
Research Abstract |
目標は、網羅的な遺伝子情報を計測されているが、被験者数は少数に限られているゲノム・オミクスデータ(高次元・小標本数データ)から表現形予測に適切な情報を抽出することにある。この課題の解決のキーとして、医学的な知識を積極的に統計方法に取り入れた。ゲノム・オミクスデータに内在している不均一性に対して医学の新しい知見を積極的に援用して、より精度の高い予測モデルの構築を行った。特に最終年度にあたり、乳がんのサブタイプのクラスリングの有効な方法を開発して、より高性能でロバストな治療予測の方法の開発を完成させた。 A. がん研究所と松浦正明研究グループとの共同研究:遺伝子発現による乳がんサブタイプのクラスタリングについて研究を完成する。現在、L1正則化を用いた統計的方法によって遺伝子選択を行いながらサブタイプ分類を行うクラスタリングの実用化を図った.これを利用して遺伝子発現の実データ解析に適用しサブタイプの予測を行った。 B.教師なし学習のための機械学習の方法として、創発クラスタリングの完成や、ブースティング方法による密度関数や回帰関数の推定法を実用化した。 以上のテーマが本年度の主題である。このための計画と来年以降より研究をより深化を計るため以下のような計画を遂行した。 1.長年にわたり共同研究を遂行しているUniversity of WarwickのJohn Copas教授と、今年度は、一般化t-統計量の研究を完成させた。 2. 台湾大学のHung 助教とAcademiaSinicaのSu-Yun Huang 博士と、機械学習と統計学の融合的発展のために大学院生の教育も含めて研究交流を行った。特に今年度は小森がアカデミア・シニカに長期滞在して共同研究を進めた。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(14 results)