研究課題/領域番号 |
16K12401
|
研究機関 | 名古屋大学 |
研究代表者 |
松井 茂之 名古屋大学, 医学系研究科, 教授 (80305854)
|
研究分担者 |
小森 理 成蹊大学, 理工学部, 准教授 (60586379)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 統計的判別解析 / 機械学習 / 疾患異質性 |
研究実績の概要 |
前年度に引き続き,最もシンプルな判別法の一つである対角線形判別解析について検討を行った.形質クラス内分散の縮小推定量の良さが敏感に性能に影響したことから,分散の縮小推定量の改善を図った.逆ガンマ分布を事前分布に用いた方法を中心に検討し,小サンプルのもとで一定の改善を確認した.ノンパラメトリックな事前分布も検討したが,計算負荷が大きくなったことからごく限られた条件下でのみしか性能を確認できなかった.一方,判別精度改善の試みとして,より複雑な判別式である分散共分散行列の正則化を伴う判別解析(Guo Y et al., 2007),L1ノルムを用いた正則化法(特に,線形回帰の設定におけるleast angle regression (Efron et al., 2004)のstage-wise変数選択の切り口)についても縮小推定量を用いた拡張を試みたが,後者については実装に至っていない.
推定した入れ子型混合モデルに基づいて,がんと健常人の判別解析法の開発を行った.新たなサンプルの発現量データが与えられたとき,がん関連遺伝子の各コンポーネントに対してそのサンプルががんである事後確率を計算した.このとき,全コンポーネントに関して様々な組み合わせの確率が考えられるが,実在しない組み合わせも多く存在すると考えられるため,各コンポーネントの併合の方法をいくつか検討した.数値実験や実データ(白血病,大腸がん,膵がんの診断研究のデータ)への適用により,従来の判別法(Fisherの線形判別分析,サポートベクターマシンなど)との性能比較を行った.なお,選抜した遺伝子セットの偽陽性の評価については,並べ替え法などを用いた簡易的な方法しか存在しないことから,入れ子型混合モデルに基づく偽陽性率の判定基準とその推定法について検討した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
H29年度は前年度の課題を引き続き検討し、数値実験や実データによる手法の評価を広範囲に行うことができ、本研究によって何が達成可能で、何が達成困難か、その見通しをほぼ立てることができたと考えている。具体的には、線形判別解析での階層モデルに基づく予測精度の評価体系の開発、疾患異質性の検出・判別解析については今後さらに検討を進めることで一定の成果を見込んでいる。以上より、おおむね順調に進展していると判断する。
|
今後の研究の推進方策 |
今年度に続き、線形判別解析における階層モデルを用いた学習データの変換に基づく予測精度の評価体系の構築を進める。併せて、がんの第二相臨床試験でゲノムデータを用いた薬剤奏効判別などを想定し、標準的なクロスバリデーションに基づく判別精度推定との比較を試みる。L1ノルムを用いた正則化法への応用とその実装にも引き続き取り組む。
疾患の異質性解析については、パラメトリックな入れ子型混合モデル解析にしぼり、今年度に引き続き、疾患異質性の構造を有さない従来の判別解析法との比較を、数値実験、実データ解析の両面で行う。その際、海外の研究協力者から提供される予定である多発性骨髄腫の病型と遺伝子発現データの関連解析のデータを新たに加える。一方、疾患異質性を規定するマーカー検出における偽陽性度の推定、及び、多重検定の方法を新たに開発し、数値実験、実データ解析の両面で性能を評価する。
|
次年度使用額が生じた理由 |
予定していた研究成果(特に、分散共分散正則化法、L1ノルム正則化法の検討結果)が揃わないことが年度の前半で判明したことから、年度内の海外での学会発表を延期した。併せて、海外研究協力者との研究打ち合わせ(米国シアトル、多発性骨髄腫のデータ解析)は、年度内に予定していた先方によるデータの準備が遅れたため、次年度に延期した。以上に伴い、平成29年度に執行予定であった海外旅費を次年度に持ち越す。
|