研究実績の概要 |
本研究は、時間・空間で変動する高次元データ(観測点数>>標本数)に,関数データ解析法による新たな統計モデルの理論的・実践的開発を行うものである. 関数データ解析とは,各個体や対象に対して,離散点で経時的・空間的に観測・測定された一組のデータを滑らかな関数として捉えて次元縮小(平滑化)を行い,その関数化データの集合から有効に情報を抽出するための統計モデルからなる一連の手法である.本研究は,大きくわけて3つの段階から構成されている. 第1段階は, 高次元データの関数データ化である. 研究対象の高次元データは複雑な構造をもつため,柔軟な基底関数の選択を行う.特に多層構造の高次元データの場合に,各層に特有の効果と誤差の仮定をおき,展開を工夫してバイアスを最小とする計画であった.2020年度は後述の通り, 第3段階の内容と関連した理由から, 非線形混合効果モデルとベイズ推定を組み合わせたアプローチで階層構造のあるデータを扱うモデルを構築した. 第2段階は, 関数データ集合に対する解析モデルの開発である. 対象データを非高次元データから多層高次元データへと進化させ,3種の統計モデルを開発する.多層構造の高次元データのための関数一般化線形モデル, さらに関数構造方程式モデルを構築して,高次元データも含む変数間の機序の解明を可能とする.2020年度は, 第3段階の内容と関連した理由から, 関数構造方程式モデルの検討を行い, さらに凸クラスタリングを関数データの枠組みで展開し,その情報をCox比例ハザードモデルの説明変数に与えたモデルを構築した. 第3段階は,医学・工学データに新モデルを適用する実践的研究である. 2020年度は分担者や協力者から提供された実際の問題への取り組みを開始し, 対象となる現象や研究目的により, 本研究の第1段階と第2段階の具体的な取り組みを決定した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2020年度は初年度であったが, 前述の通り, 第1, 第2段階を第3段階と同時進行することで, 実践的な問題を解明するために必要となるモデリングを考慮することが可能となった. 第1段階における, 時間と共に推移する高次元データへの取り組みに関しては, 第3段階にある, 研究分担者からの新生児ホルモン分泌経時測定データから新生児の体内リズムを明らかにする問題に対し, 現象解明のための必要性から, 平均的な経時的推移ではなく, 現象の分位点の推移を捉えることのできるモデルを考慮し, 多層の扱いについても, 当初予定していた方法ではないアプローチである, 非線形混合効果モデルとベイズ推定を分位点回帰の枠組みで組み合わせたアプローチによりモデリングを行った。提案手法とその適用結果から明らかになった結果は学会発表を行い, さらに国際誌へ論文投稿中である. 第2段階に関しては, 経時的・空間的変動を捉える関数データの集合を含む因果推論のモデルを検討するとともに, 関数データ集合をその経時的推移の特徴から分類し, 各変動パターンの生存時間への影響を明らかにするためのモデルを検討した. 第3段階に関しては, 体の複数個所で測定された手話学習者の手の動きに関するセンサーデータに対して, 多変量関数主成分分析を適用し, これまでの深層学習等の手法ではみられなかった手話学習者の特徴を捉えることができ, 学術論文として発表した.
|
今後の研究の推進方策 |
2020年度に構築した統計モデルの評価方法の検討に取り組む. さらに, 正則化最尤法による推定を行っている場合には, ベイズ推定の場合とその性質を比較・検討する. モデルの設定・推定・評価が完成した手法については, 数値実験によってモデルの性質の確認と他の手法との比較を行い, さらに実データへの実装を行う. 実データの解析結果は, データ提供者である研究分担者らと共に解釈を行う. 論文投稿や学会発表に関しては, 先行研究について改めて入念に調査し, 本研究で提案したモデルの有用性や限界を数値実験の結果と併せて明確にする.
|