研究概要 |
本年度においては,主に,バイオインフォマティックス分野における生命科学データから有用な情報を抽出するための統計的モデリング手法の開発研究に取り組んだ.バイオインフォマティックス分野において,近年,遺伝子セットを単位とする多変量的解析に注目が集まっている.その中でも遺伝子パスウェイの情報を用いた解析手法が近年注目を集め,パスウェイと疾患との関係性を捉えるためのいくつかの統計モデルが提案されている.申請者は,疾患の多様性を特徴付ける遺伝子パスウェイを同定するために,確率的主成分分析モデルに基づき,マイクロアレイデータから各遺伝子パスウェイの活性度を求める統計的手法を確立した.得られた活性度に対してロジスティックモデルを構築し,lasso型推定法の一種であるelastic net型推定法に基づいてモデルの推定を行った.Elastic net型推定法により推定されたロジスティックモデルに対するモデルの自由度を定義し,構築されたモデルを客観的に評価するために新たなにモデル評価基準を導出した.提案手法を乳がん患者の識別・判別問題に適用した.研究成果は研究論文として発表するとともに,国内外の学会や研究集会で発表した.また,ラベルありデータとラベルなしデータの両方のデータを用いることにより構成される半教師あり学習法に関する研究についても昨年度に引き続き行った.特に,データ集合が関数として与えられる場合におけるモデリング手法の開発研究を行った.提案したモデリング手法を,モンテカルロ・シミュレーションによる数値実験やマイクロアレイデータの識別・判別問題に応用することにより,その有用性をさまでな側面から検証した.得られた研究成果は,研究論文としてまとめて現在学術雑誌に投稿中(arXiv : 1102.4399で公開中)である.
|