研究実績の概要 |
本研究は、時間・空間で変動する高次元データに,関数データ解析法による新たな統計モデルの理論的・実践的開発を行うものである. 関数データ解析法とは,各個体や対象に対して,離散点で経時的・空間的に観測・測定された一組のデータを滑らかな関数として捉えて関数化して平滑化を行い,その関数化データの集合から有効に情報を抽出するための統計モデルからなる一連の手法である. 本研究では,まず第1段階において, 高次元データの関数データ化について検討した.特に多層構造の高次元データの場合に,各層に特有の効果と誤差の仮定をおき,展開を工夫してバイアスを最小とする計画であった.2021年度は前年度の研究を継続し, 第3段階において本研究で扱う医学データの構造に関連した理由から, 当初の予定とは異なるアプローチで階層構造のあるデータを扱うモデルを構築した. 第2段階は, 関数データ集合に対する解析モデルの開発である. 対象データを非高次元データ,高次元データ,多層高次元データと進化させ,3種の統計モデルを開発する計画である. 2021年度は,凸クラスタリングを関数データの枠組みで構築し,その情報をCox比例ハザードモデルの説明変数に与えたモデルを検討した. さらに, 複雑な構造を有する現象において, 時間の経過に伴い分散が変動する現象を捉えるため, 分位点の枠組みで非線形な構造を捉えるモデルを構築した. 第3段階は,医学・工学データに新モデルを適用する実践的研究である. 2021年度は前年度に引き続き, 研究分担者から提供された実際の問題への取り組みを開始し, 対象となる現象や研究目的により, 本研究の第1段階と第2段階の具体的な取り組みを決定した.第2段階で開発した統計モデルを、そのうちの1つである小児ホルモン分泌データへ適用し、乳児の体内周期に関する新たな知見が示唆された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2021年度は当該研究課題の2年目であったが, コロナ禍の影響により, 研究グループの当事者間や国際会議の場での十分な議論が困難であり, さらに広く新たな知見を得る機会も得られなかった. このため, 2021年度は, 前年度に手掛け始めた内容を遂行することに終始した. 一方で, 研究分担者からの新生児ホルモン分泌経時測定データから新生児の体内リズムを明らかにするための統計モデルの開発は, 前年度までの複数回にわたる議論により, おおむね順調に進んだ. 現象の平均的な経時的推移ではなく, 現象の分位点の推移を捉えることのできるモデルを考慮し, 多層構造の扱いについても, 当初予定していなかった方法でモデリングを行うことができ. 提案手法とその適用から明らかになった結果は, 学会発表を行い, さらに国際誌へ採択された. 経時的・空間的変動を捉える関数データ集合を含む因果推論のモデルの検討は初期のモデリングの段階から進んでいない. 一方で, 関数データ集合をその経時的推移の特徴から分類し, 各変動パターンの生存時間への影響を明らかにするためのモデルの検討は継続中であり, これまでの成果は国際会議で発表した. 体の複数個所で測定された手話学習者の手の動きに関するセンサーデータに対して多変量関数主成分分析を適用した研究は昨年度学術論文に掲載されたが, 新たに開発中の関数クラスタリングを多変量の枠組みに発展させ, 分類を行う予定である. さらに, 協同研究者は前述の多変量関数主成分分析を用いた手法を実装したシステムを構築し, 自動で手話学習者の上達度を測定できる装置を開発中である.
|
今後の研究の推進方策 |
前年度に引き続き, 経時的・空間的変動を捉える関数データの集合を含む因果推論のモデルを検討する. 関数データ集合を分類し各変動パターンの生存時間への影響を明らかにするモデルについて, ジョイントモデルの可能性やモデル評価のための基準を検討するとともに, 実データへの適用をさらに推進する. また, 学術誌に採択されたベイズ型非線形分位点回帰モデルに関して, 残された課題となった, 推論に関する問題に挑戦し, モデル評価について検討する.
|