2003 Fiscal Year Annual Research Report
高次元データによる複雑非線形現象解明のための柔軟な統計モデルの理論・方法論の研究
Project/Area Number |
15700231
|
Research Institution | The University of Tokyo |
Principal Investigator |
井元 清哉 東京大学, 医科学研究所, 助手 (10345027)
|
Keywords | ノンパラメトリック回帰 / ベイジアンネットワーク / 情報量規準 / ベイズアプローチ / 高次元データ |
Research Abstract |
平成15年度に行った研究について以下にまとめます. (1)B-スプラインに基づくノンパラメトリック回帰モデルの推定に関しては,B-スプラインの個数と平滑化パラメータの選択が本質的となる.そのための新しい情報量規準を導出し,人工データ,実データの解析を通してその有効性を検証した. (2)超多数の確率変数に対して,その因果関係を観測データから抽出するためのベイジアンネットワークに基づく統計モデルを提案し,マイクロアレイ遺伝子発現データに適用した.マイクロアレイデータの解析においては,観測値の不等分散性が問題となる.そのため,ノンパラメトリック回帰モデルに不等分散性を取り入れモデルを推定する方法を提案した.その結果,遺伝子の制御関係を表す遺伝子ネットワークの推定が可能となり,いくつか,新たな制御関係を示唆する結果を得ることが出来た. (3)確率変数間の依存関係に対して部分的に既知の情報が利用可能であるとき,そのデータベース情報と観測データを用い依存関係の抽出を行う方法を提案した.その手法の特色は観測データとデータベース情報とのバランスをとりつつ依存関係の抽出を行う点にある.そのための新しいベイズ型情報量規準を導出し,人工データ,実データに適応しその有効性を検証した. (4)一塩基多型データ,いわゆるSNPによる罹患リスクの予測,および分類は,観測されるデータが本質的に離散値をとることや,予測に有効なSNPの候補が数万にも及ぶなど,実際のデータ解析に対して様々な困難が生じる.我々は,ロジスティック回帰モデルに基づくSNPと環境因子を考慮に入れたリスク予測モデルを提案し,実際の糖尿病データに適用した.。その結果,いくつかのSNPは単独では予測への貢献は低いものの,環境因子との交互作用が強く見られ,交互作用をモデルに入れることによる効果が分かった.
|
Research Products
(4 results)
-
[Publications] Imoto S., Konishi S.: "Selection of smoothing parameters in B-spline nonparametric regression models using information criteria"Annals of the Institute of Statistical Mathematics. 55. 671-687 (2003)
-
[Publications] Imoto S. et al.: "Bayesian network and nonparametric heteroscedastic regression for nonlinear modeling of genetic network"Journal of Bioinformatics and Computational Biology. 1(2). 231-252 (2003)
-
[Publications] Imoto S. et al.: "Bayesian network and nonparametric heteroscedastic regression for nonlinear modeling of genetic network"Proc. 2nd IEEE Computational Systems Bioinformatics. 104-113 (2003)
-
[Publications] Nakamichi R. et al.: "Case-control study of binary trait considering interactions between SNPs and environmental effects using logistic regression"Proc. 4th IEEE Bioinformatics and Bioengineering. in press. (2004)