高次元データによる複雑非線形現象解明のための柔軟な統計モデルの理論・方法論の研究
Project/Area Number |
15700231
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Statistical science
|
Research Institution | The University of Tokyo |
Principal Investigator |
井元 清哉 東京大学, 医科学研究所, 助手 (10345027)
|
Project Period (FY) |
2003 – 2004
|
Project Status |
Completed (Fiscal Year 2004)
|
Budget Amount *help |
¥3,400,000 (Direct Cost: ¥3,400,000)
Fiscal Year 2004: ¥1,500,000 (Direct Cost: ¥1,500,000)
Fiscal Year 2003: ¥1,900,000 (Direct Cost: ¥1,900,000)
|
Keywords | ノンパラメトリック回帰 / ベイジアンネットワーク / ベイジアンモデリング / クラスタリング / 高次元データ / 関数データ解析 / 情報量規準 / ベイズアプローチ |
Research Abstract |
平成16年度に行った研究について以下にまとめます. (1)数千というオーダーの超多数確率変数の関連,特に因果関係を捉えるために平成15年度はベイジアン・ネットワークとノンパラメトリック回帰を組み合わせた統計モデルを提案し,その有効性をcDNAマイクロアレイによって観測された遺伝子発現データの解析を通し検討した.しかしながら,超多数の確率変数の関連を有向グラフ(directed graph)によってモデリングする際,観測されるデータのみからの推測では,そのサンプルサイズ,含まれる情報量から明らかな限界があること分かった.そのような場合,グラフ構造の事前知識を用いることが極めて有効であると考え,目的となる確率変数の関連・因果関係を表す有向グラフを推定するためのあらゆる知識,利用可能な様々なデータを階層モデルにまとめ,それらを統合するベイズモデルを構成した. (2)癌の分類・予測を目的に観測されたマイクロアレイ遺伝子発現データのクラスタリングに対しては従来の混合分布に基づく方法は,モデルに含まれる超多数のパラメータのため過適合をおこし有効に働かない.そこで因子分析の方法を拡張した超高次元特徴ベクトルを有する少数サンプルのクラスタリングのための手法(Mixed Factors Analysis)を開発した.
|
Report
(2 results)
Research Products
(9 results)