研究課題/領域番号 |
18H03211
|
研究機関 | 統計数理研究所 |
研究代表者 |
江口 真透 統計数理研究所, 医療健康データ科学研究センター, 特任教授 (10168776)
|
研究分担者 |
小森 理 成蹊大学, 理工学部, 准教授 (60586379)
林 賢一 慶應義塾大学, 理工学部(矢上), 准教授 (70617274)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | 一般化平均 / 情報幾何 / 準線形モデル / 生存解析 / クラスター分析 |
研究実績の概要 |
一般化平均を用いた統計予測法の提案・開発のための研究をを行った. 特に,生存解析におけるコックスの比例ハザード回帰モデルの一般化平均の予測子の開発に尽力した.この予測モデルにおいて偏尤度の理論的整合性を考察した.リスク因子の選択のためにL2クロス・ラッソ法を提案して乳がんの実データ解析に適用して有効性が確かめられた.これらの成果はBMC Medical Research Methodology誌に採録された. これは従来の一般化線形モデルにおける線形予測を超えてデータに横たわる非線形性を捉える一般的な方法論として,生存解析も加えることによっての一般化平均予測法の確立に一歩近づいたと思われる. 次に教師なし学習の内容で広く使われているクラスター分析のについて各クラスターのエネルギー関数の一般化平均による統一的定式化を行った.これによってK平均,ファジーC平均,ガウシアン・ミクスチュアーなどを統一的視点を与えることに成功し,更に,これらの手法を改良する新たな手法の提案を行った.特に,生成関数として1変量生存関数を採用することによってクラスター手法の確率的解釈が与えられた.典型例では指数分布,パレート分布の生存関数が生成する一般化平均が集中的に考察した.この確率的解釈を進めてクラスターの総エネルギーの損失関数を提案した.その損失関数の最小化によって一般化クラスター分析が導かれ,特例としてK平均,ファジーC平均を含む.クラスターの確率分布モデルを定義して,このモデルの下で一般化クラスター分析の漸近的一致性が示された.これらの成果はEntropy誌に採録された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
従来の線形モデルでは捉えられない非線形性を捉える方法論として一般化平均を使った準線形モデルの完成と普及が本研究計画の骨子である.一般化平均による非線形性についての理解から具体的な準線形モデルの応用拡大が教師なし学習と教師あり学習の両方に図られたことを鑑みて計画は順調に進展していると思われる.
|
今後の研究の推進方策 |
一般化平均を用いた統計予測法のプロジェクトの集大成を進める.昨年度において動的治療計画への適用が進んだが,今後,論文発表を行いたい.教師なし,教師ありのデータ学習の大きな枠組みの中で,一般化平均の方法論を確立と普及を推進したい. メタ解析の内容で過去の解析結果を結合するための方法論,また予測結果の評価法などについても一般化平均の考えのアイディアを得たがを適用拡張性について調査したい. バイオマーカーなどの共変量に基づき,興味ある事象をどの程度正しく予測できるかどうかを評価することは,医学研究などにおける重要な統計的課題である.多値の応答変数に対する回帰モデルの予測力を各々のオッズ関数の幾何平均を使った指標を提案した.現在,様々な設定での数値実験を通して論文発表の準備中である..
|