研究課題/領域番号 |
19300100
|
研究機関 | (財)癌研究会 |
研究代表者 |
松浦 正明 財団法人癌研究会, 癌研究所・がんゲノム研究部, 部長 (40173794)
|
研究分担者 |
江口 真透 統計数理研究所, 数理推測研究系, 教授 (10168776)
藤澤 洋徳 統計数理研究所, 数理推測研究系, 準教授 (00301177)
磯村 実 財団法人癌研究会, ゲノムセンター, 研究員 (40272497)
宮田 敏 財団法人癌研究会, ゲノムセンター, 研究員 (60360343)
牛嶋 大 財団法人癌研究会, ゲノムセンター, 研究員 (60328565)
|
キーワード | 統計数学 / ゲノム / マイクロアレイ / プロテオーム / 遺伝子発現 / オミックスデータ / 生体生命情報学 / 機械学習 |
研究概要 |
平成19年度は、臨床オミックスデータの中でも世界的に最も多くの施設でデータが取得されているマイクロアレイによるトランスクリプトームデータに対し、(1)疾病関連因子の探索理論の構築と(2)関連因子探索のための解析プログラムを開発した。 (1)疾病関連因子の探索理論の構築においては、癌を多因子遺伝子疾患のモデルとし、疾患制御因子を探索・同定するためのプロセスとして、(A)パスウェイの最少単位としての2変量の交互作用項を考慮したロジスティック回帰モデルの中から、2段階機械学習法により表現型との関連が強いモデルを絞り込み、次に(B)表現型に強く関連している生物学的機能を探索するための手法として、Webで広く公開されている生物学的情報であるGene Ontologyデータを用い、表現型と強く関連する生物学的機能を示すタームを統計学的に抽出するためモンテカルロ有意確率を抽出のためのスコアとして算出する方式を検討した。さらに(C)開発したシステムに対し臨床情報を有する実データを用いて解析・検証を行った。神経芽細胞腫のデータを利用し、患者の予後予測とメカニズムの推測を試みたところ、モデルのバリデーション成績である誤判別率は0.12の値を示し、従来法よりも小数の遺伝子を用いたモデルであっても高精度な予測が可能であった。また予後を規定するメカニズムの推測を試みた結果、細胞増殖、Gタンパクシグナル、解糖系、神経生理プロセス、カテコールアミン代謝等が予後に影響するものと推測された。本結果を2008年のバイオコンヒ。ユーティングのシンポジウム(ハワイ)で報告し、海外の多くの研究者と検討を行った。
|