研究課題
2015年度は,順序カテゴリカル応答,及び競合リスクを伴う生存時間データに対する非線形回帰モデルの提案を行った.(1) 順序カテゴリカル応答に対する多変量適応型回帰スプライン法:医学研究では,疾患の重症度(軽度,中程度,重度)など,順序カテゴリカル応答としてとられることが多い.一方で,非線形回帰手法の順序カテゴリカル応答に対する研究は少ないように思われる.そのため,本研究では,多変量適応型回帰スプライン法(MARS; Friedman, 1992)を順序カテゴリカル応答に拡張した.そこでは,比例オッズモデルの枠組みのもと,偏分残差を損失関数として取り扱い,線形モデルおよび樹木モデルに比べて,高い予測確度を示すことができた.(2) 競合リスクを伴う生存時間データに対するルール・アンサンブル法:競合リスクとは,生存時間研究において,関心があるイベントが起きる前に別のイベントにより観測不可能となるリスクである.例えば,HIV研究において,関心があるイベントをAIDSの発症とするとき,当該患者のAIDS以外での死亡は,競合リスク・イベントになる.このとき,競合リスク・イベントを中途打ち切りにすることは,関心のあるイベントの発症リスクを甘く見積もる傾向にある.そのため,競合リスクを伴う生存時間データに対する生存時間解析が必要になる.本研究では,予測確度に優れ,かつ推定されたモデルのなかで予測に対して影響の強い要因が「IF~Then」のプロダクション・ルールで解釈できるRuleFit法(Friedman & Popescu, 2008)拡張した.そこでは,部分分布ハザードモデルの枠組みを用い,その偏分残差の一次導関数を用いた樹木構築の方法を作成し,モデル刈り込み方法には,Fu et al.(2015)によって提案された,部分分布比例ハザード・モデルに対するlasso法を適用した.
2: おおむね順調に進展している
2015年度は,初年度ということもあり,研究の準備段階に位置付けている.そこでは,新たな計算環境を整備するとともに,資料の情報収集が順調に推移したと考えられる.研究活動については,競合リスクに対するルール・アンサンブル法の開発に着手するとともに,諸種の縮小推定の選定に関しても研究をスタートすることができた.このことは,前回の科研費で提案した方法の精緻化が可能になることを意味する.また,競合リスクを伴う生存時間データに対するルール・アンサンブル法の開発は,その過程において,樹木モデル(基本学習器)の新たな提案を行う必要があることを発見した.競合リスクを伴う生存時間データに対する樹木モデルは,Callaghan(2008)及びIbrahim et al.(2008)によって提案されているものの,ふし間不均一性測度に基づくCART法による樹木モデルは提案されておらず,競合リスクを伴う生存時間データに対するルール・アンサンブル法の開発の中で,新たに提案した.この樹木モデルの提案自体も,新たな研究の一つであり,副産物的な知見であったと考えている.研究成果では,前回の科研費(文部科学省 科研費(若手B),癌臨床研究におけるレスポンダーおよびシグナル検出のための統計的機械学習法の開発)の継続研究として,順序カテゴリカル応答に対する多変量適応型回帰スプライン法が日本計算機統計学会誌に掲載された.また,統計関連学会 連合大会において,競合リスクを伴う生存時間データに対するルール・アンサンブル法の提案を発表した.さらに,日本行動計量学会において,これまでの非線形回帰手法(樹木構造接近法)の研究が評価され,「日本行動計量学会,2015年度 優秀賞(林知己夫賞)」を受賞した.
平成28年度は,競合リスクを伴う生存時間データに対する非線形回帰モデルの開発を本格化させたいと考えている.そのために,非線形回帰手法を,(1)予測確度の向上,(2)予後因子の探索,(3)任意の治療法に対するレスポンダーの探索,に分けて考える.(1)予測確度の向上:前年度に開発した競合リスクを伴う生存時間データに対するルール・アンサンブル法の論文化に向けた数値検証を実施するとともに,論文を執筆・投稿する.また,副産物的に開発した樹木モデルと既存の方法との比較をシミュレーションを通じて実施する.さらに,競合リスクを伴う生存時間データに対するルール・アンサンブル法の解釈を支援するためのグラフィカル手法の開発を実施する.(2)予後因子の探索:これまでに研究した,多変量適応型回帰スプライン法(MARS; Friedman, 1992)及び,ABLE法(LeBlanc & Tibshirani, 1993)を競合リスクを伴う生存時間データに拡張したいと考えている.これは,部分分布ハザード・モデルの枠組みで拡張できると考えている.MARS法及びABLE法では,最適モデルを選定する「何らか」の基準が必要である.そのため,情報量規準による方法と縮小推定による方法の2種類の方法から取捨選択する必要がある.(3) レスポンダー探索:Friedman & Fisher(1999)が提案した,ルール帰納法(PRIM)のアルゴリズムを応用することが考えられる.このとき,モデル構築の評価基準には,部分分布ハザード,あるいは,Gray検定の検定統計量(あるいはp値)を用いることが考えられる.ただし,PRM法は,強欲(greedy)なアルゴリズムであるため,方向付けピーリング(LeBranc et al.,2003 )を用いる必要がある.
すべて 2016 2015
すべて 雑誌論文 (7件) (うち査読あり 6件、 オープンアクセス 7件) 学会発表 (6件)
日本感性工学会論文誌
巻: 15 ページ: 163-172
Journal of Neurosurgery
巻: 124 ページ: 350-358
10.3171/2015.1
Support Care Cancer
巻: 24 ページ: 933-941
BMC Gastroenterol.
10.1186/s12876-015-0385-0
Endoscopy International Open
巻: 3 ページ: E318-E322
10.1055/s-0034-1392095
巻: 14 ページ: 207-214
計算機統計学
巻: 28 ページ: 121-136