2008 Fiscal Year Annual Research Report
ゲノムデータからの予測・発見・推論の統合化のための統計学と機械学習の融合
Project/Area Number |
20240028
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
江口 真透 The Institute of Statistical Mathematics, 数理・推論研究系, 教授 (10168776)
|
Co-Investigator(Kenkyū-buntansha) |
栗木 哲 統計数理研究所, 数理・推論研究系, 教授 (90195545)
藤澤 洋徳 統計数理研究所, 数理・推論研究系, 准教授 (00301177)
逸見 昌之 統計数理研究所, 数理・推論研究系, 助教 (80465921)
松浦 正明 癌研究会癌研究所, がんゲノム研究部癌研究会ゲノムセンター・情報解析グループ, 部長・グループリーダー兼任 (40173794)
|
Keywords | マイクロアレイ / ROC曲線 / 順序カテゴリー / SNP / スパース学習 / AUCBoost |
Research Abstract |
バイオインフォマティックスのための新たな統計科学を構築・推進するために特に以下の2点に力点をおいた. (1)統計的パタン認識:パタン認識の性能を測るROC曲線の上側面積(AUC)を最大化するブースト法について開発した。 AUCBoostの開発は,主に江口,小森によって研究を進めた。また三浦がプログラムのサポートを行った。次に,表現形によって定めるクラスラベルについて,順序カテゴリーを成す場合,例えば,疾病の程度や治療の効果を表す場合についてブースティングを提案した。国立がんセンターの田村グループとの共同研究において乳がんの治療効果を予測するためのマイクロアレイデータの解析が急速に進み上記の方法の実用化に目処がついた。また既存の方法との比較についても詳細な研究ができ,幾つかの特徴的な結果が得られ,論文化を急いでいる.またこのミクロアレイは治療前と治療後に採られていることから治療薬の影響をより詳細に解析できる.これについても良好な特徴パターンが発見されている.特徴ベクトルの情報を選択的に学習する正則化についてもスパース学習,Lasso,Least Angle回帰など援用が検討された. (2)SNP+マイクロアレイ:同一の被験者に対してSNPsデータとマイクロアレイデータを得て,高次元小標本問題による弱い統計的証拠を強めるための方法を開発した。松浦研究チームは、開発されたノウハウをもとにして、ゲノム全体を対象とする大規模なSNPのハプロタイプとそのブロッキングの同定法の開発を検討した。なお、本研究で使用するSNPデータはWeb上で公開されているものであり、倫理面での問題はない。さらに松浦研究チームは、肺癌の同一サンプルに対するSNPsデータとマイクロアレイデータを最近取得し、種々の臨床情報ラベルが付いた解析が可能となり,同時解析を行った。この研究は、主として研究分担者の松浦が中心になって連携研究員の牛嶋と行った。
|
Research Products
(19 results)