研究概要 |
顕微質量分析からの二次元蛋白データは、相関構造を持ったTOF/MSデータの集合であり、蛋白発現プロファイルの関数データの抽出にはin homogeneously smoothな関数の平滑化が必要である。このため、不連続点あるいは微分不能な点を含む目的関数を、ノイズを含んだデータから推定するのに適したadaptive free-knot splineの理論的研究およびプログラム開発を行った。また、蛋白発現データを微分不能な点を持つ確率分布から得られたものと解釈し、きわめて特異な確率密度関数の推定問題として研究した。さらにこれらを用いた判別問題への応用も検討した。 これら不均一な滑らかさを持つ関数データの抽出、確率密度関数の推定、判別問題の解決は、多重節点を持つスプライン関数を用いてモデル化された。スプライン関数のtuning parameterである節点の最適化は、適応型モデル撰択基準(adaptive model selection criterion)を最適化することで行われた。この最適化問題は複雑な非線形問題となるが、遺伝的アルゴリズムを適用することで、大域的な最適解を探索することで解決した。 顕微質量分析計データから、ROI(Region of Interest)の判別に有用なピーク情報を抽出するため、重複するラグ・ウィンドウのうえで局所的な関数主成分分析を行い、第一、第二主成分プロットに対してk最近傍法による非階層型クラスタリングを用いる方法を検討した。これによりROIの判別に有用なタンパク発現ピークを、効率的に探索する方法にめどを付けた。この研究は料学研究費研究集会「ノンパラメトリック統計解析とベイズ統計」で発表する予定で準備を行った。(2009年3月24,25日に筑波大学にて予定されたが、東北地方大震災の影響で中止された。)
|