研究概要 |
近年様々な研究分野や社会領域で膨大な時系列データが集積されている中,データ測定技術の革新や情報技術の高度化に伴い,データベクトルの高次元化が著しく進行している.その一方で,研究体制の未整備や社会的費用に関する諸問題が原因で,データベクトルの次元(p)に比べて,集積可能なサンプル数(n)が極端に少ない時系列データが顕在化している.このようなデータの次元とサンプル数の極端な不均衡は統計科学において「n<<p問題」と呼ばれ,従来の統計理論の多くがその有効性を失うことから,現時点で確立された統計解析技術は未整備のままである.本研究では,時系列データの「n<<p問題」に焦点を絞り研究を推進してきた.数理的研究としては,「状態空間モデルと正則化自己回帰モデルとの関連性についての考察」,「統計的正則化理論に基づく状態空間モデルの推定手法の開発」を行った.また,応用領域として,「時系列マイクロアレイデータに基づく遺伝子制御ネットワークの推定」を行い,原著論文としてまとめた.具体的には,膨大なシミュレーション実験や理論研究に基づき,推定された遺伝子ネットワーク個々に対して,その信頼度に応じてスコアリングを行うシステムを開発した.また,開発手法が実問題においてどの程度の高次元性に対して有効に機能するのかを検証し,サンプル数が二十弱,データの次元が数百のオーダーのデータに対しても十分な性能を示すデータ解析技術の開発に成功した.
|