研究分担者 |
川崎 能典 統計数理研究所, モデリング研究系, 助教授 (70249910)
上野 玄太 統計数理研究所, モデリング研究系, 助手 (40370093)
染谷 博司 統計数理研究所, モデリング研究系, 助手 (00333518)
玉田 嘉紀 統計数理研究所, 統計科学技術センター, 助手
井元 清哉 東京大学, 医科学研究所・ヒトゲノム解析センター, 助手 (10345027)
|
研究概要 |
生物学的知識を無向グラフィカルモデルであるマルコフランダム場モデルとして表現し,DNAアレイデータに現れた遺伝子間相互作用を表すベイジアンネットワークを組み合わせた枠組みで研究をすすめている.ベイジアンネットワークにおいて矢印の太さを推定する作業は,統計の伝統的専門分野である非線形回帰問題に帰着できる.普通の非線形回帰問題は,回帰される変数に誤差を仮定しないが,本研究ではそこにも観測誤差を仮定した非線形回帰の枠組みですすめた.一つの条件付分布について非線形回帰を行い,そこからの結果をその遺伝子が影響している次の遺伝子に関する非線形回帰に反映させる.それらを順次繰り返すことで,トータルで一つの同時分布を推定する作業とした.一つ一つの非線形回帰問題で問題となる,ブートストラップのやり方に関するフリーなパラメータ値は,n個の条件付分布に関しても一定のものになるような評価でもって,consistentになるように定めた.マルコフランダム場モデルとして表された事前情報をどの程度組み込むかはハイパーパラメータが制御するが,その決定を最尤法で行おうとすると組み合わせ爆発をする計算を行う必要がある.従ってこれまでは周辺尤度の上限値,下限値をもとめることで,間接的にこの値を推定していた.よって,この尤度の見積もりがどの程度精密なのか,あるいは全く別の観点からのハイパーパラメータの決定法を考察するなど,ハイパーパラメータの推定法に関する数理的課題に取り組んだ.これらと平行して,状態空間モデルを利用したDNAアレイデータの解析手法の情報収集と新しい手法の開発を始めた.また,タンパク質工学における望みの機能をもつタンパク質の発見の過程を情報科学における最適化とみなし,タンパク質工学への応用のための遺伝的アルゴリズムの一手法を示しつつ,その有効性を計算機実験により確認しウェットな実現の可能性を探った.
|