本年度は、1)surface-enhanced laser desorption/ionization time-of-flight(SELDI-TOF)質量分析計を用いて計測した蛋白質の発現データから、蛋白質の発現に対応するpeakを同定する方法論の開発、2)臨床サンプルからのデータ抽出、および3)臨床情報に現れた表現形に基づく判別手法の開発を行った。具体的には、1)微分不可能なpeakの形で蛋白発現が観察されるプロテオームデータの特性に鑑み、spline関数によるデータのsmoothingとS/N比に基づくpeak detectionを行った。Spline関数のknot sequenceの最適化には、adaptive model selection criterionをモデル選択基準として使用し、その最適化には遺伝的アルゴリズムを用いた。以上の研究成果は論文としてまとめ、日本統計学会誌(欧文誌)に投稿した。2)臨床サンプル方のデータ抽出に関しては、財団法人癌研究会付属病院において、インフォームドコンセントの取れた乳がん、および大腸がんの患者から抹消血および患部組織を採取し、データを収集した。集められたデータは匿名化を施した上で解析用に加工整理し、簡易データベースに蓄積して管理した。3)データの解析については、抽出した発現プロファイルから1)の方法でpeak情報を得た後、検体間で補正を施した。また、癌種、および抗がん剤感受性に関する判別を行うため、まず二標本検定によって検体のタイプによって発現量の異なる蛋白発現ピークを抽出し、それら候補蛋白の発現にAdaBoostなどの手法を適用して判別を行った。これらの内容については、日本癌学会、アメリカ癌学会特別カンファレンス等で報告するとともに、内容をまとめて日本計量生物学会学会誌等に掲載した。
|