2010 Fiscal Year Annual Research Report
関数データとしての蛋白発現データ解析と癌個別化診断の試み
Project/Area Number |
22500271
|
Research Institution | Japanese Foundation For Cancer Research |
Principal Investigator |
宮田 敏 財団法人癌研究会, ゲノムセンター, 研究員 (60360343)
|
Co-Investigator(Kenkyū-buntansha) |
磯村 実 島根大学, 医学部, 講師 (40272497)
|
Keywords | ゲノム統計解析 / 関数データ解析 / 非線形回帰 |
Research Abstract |
顕微質量分析からの二次元蛋白データは、相関構造を持ったTOF/MSデータの集合であり、蛋白発現プロファイルの関数データの抽出にはin homogeneously smoothな関数の平滑化が必要である。このため、不連続点あるいは微分不能な点を含む目的関数を、ノイズを含んだデータから推定するのに適したadaptive free-knot splineの理論的研究およびプログラム開発を行った。また、蛋白発現データを微分不能な点を持つ確率分布から得られたものと解釈し、きわめて特異な確率密度関数の推定問題として研究した。さらにこれらを用いた判別問題への応用も検討した。 これら不均一な滑らかさを持つ関数データの抽出、確率密度関数の推定、判別問題の解決は、多重節点を持つスプライン関数を用いてモデル化された。スプライン関数のtuning parameterである節点の最適化は、適応型モデル撰択基準(adaptive model selection criterion)を最適化することで行われた。この最適化問題は複雑な非線形問題となるが、遺伝的アルゴリズムを適用することで、大域的な最適解を探索することで解決した。 顕微質量分析計データから、ROI(Region of Interest)の判別に有用なピーク情報を抽出するため、重複するラグ・ウィンドウのうえで局所的な関数主成分分析を行い、第一、第二主成分プロットに対してk最近傍法による非階層型クラスタリングを用いる方法を検討した。これによりROIの判別に有用なタンパク発現ピークを、効率的に探索する方法にめどを付けた。この研究は料学研究費研究集会「ノンパラメトリック統計解析とベイズ統計」で発表する予定で準備を行った。(2009年3月24,25日に筑波大学にて予定されたが、東北地方大震災の影響で中止された。)
|