2008 Fiscal Year Annual Research Report
蛋白発現データ解析のための統計モデルの研究と癌個別診断の試み
Project/Area Number |
19500250
|
Research Institution | Japanese Foundation For Cancer Research |
Principal Investigator |
宮田 敏 Japanese Foundation For Cancer Research, ゲノムセンター, 研究員 (60360343)
|
Keywords | 蛋白発現データ / adaptive density estimation / adaptive model selection |
Research Abstract |
質量分析計からの二次元蛋白データは、相関構造を持ったTOF/MSデータの集合であり、蛋白発現プロファイルの関数データの抽出にはinhomogeneously smoothな関数の平滑化が必要である。本年度は、このために必要なadaptive free-knot splineの理論的研究およびプログラム開発を行った。また、蛋白発現データを微分不能な点を持つ確率分布から得られたものと解釈し、きわめて特異な確率密度関数の推定問題として研究した。さらにこれらを用いた判別問題への応用も検討した。 これら不均一な滑らかさを持つ関数データの抽出、確率密度関数の推定、判別問題の解決は、多重節点を持つスプライン関数を用いてモデル化された。スプライン関数のtuning parameterである節点の最適化は、適応型モデル選択基準(adaptive model selection criterion)を最適化することで行われた。この最適化問題は複雑な非線形問題となるが、遺伝的アルゴリズムを適用することで、大域的な最適解を探索することで解決した。 研究の成果は、日本癌学会学術総会、統計関連学会連合大会などの国内学会、および、台北大学で行われた中国統計学会、日本統計学会、韓国統計学会合同のjoint statistical con ference of CSA-JSS-KSSでの招待講演で報告した。また主要研究成果は論文発表のため投稿準備中である。
|