研究課題/領域番号 |
16K20899
|
研究機関 | 東北大学 |
研究代表者 |
水野 聖士 東北大学, 東北メディカル・メガバンク機構, 助教 (80646795)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 情報学 / 生命情報学 / 産婦人科学 / 産科学 / 機械学習 |
研究実績の概要 |
妊娠高血圧症候群(HDP)は、全妊婦の約7%に起こる、高頻度かつ重症化しやすい疾患である。HDPは母体の周産期死亡のリスクを高めると共に、胎児機能不全や早産を誘発し、妊娠中断や児の後遺症リスクを増大させるため、児の生命や予後への影響も大きい。これまでに、HDPの原因解明のために疫学研究、家族性連鎖研究などが行われ、遺伝因子・曝露因子を含む多くのリスク因子の関与が指摘されると共に、発症予測のために多くの研究がされているが、その病態は不明であり、有効な発症予測が可能な変数の組み合わせは見つかっていない。これまでに本研究では、東北メディカル・メガバンク計画で収集された、調査票情報や血液検査情報などの多種類の情報リソースからなるデータセットを入力とし、深層学習等の機械学習を適用するための前処理の検討および、妊娠高血圧症候群の病型を高精度に予測可能な機械学習モデルの検討を行なってきた。本年度は、前年度に構築した妊娠高血圧症候群の病型を高精度に予測可能な機械学習モデルの学習結果を解析し、予測の責任変数セットとその寄与度を得るためのアルゴリズムについて検討を行なった。具体的には、教師なし学習により、高精度に表現形に関連する変数を取得するHSIC-Lasso法による変数選択法と、教師あり学習で医学系データの分類で高い性能を発揮することが期待され、入力された変数の分類への寄与を得ることができるランダムフォレスト法による分類を組み合わせた手法により、学習結果における予測の責任変数セットとその寄与度を得ることに成功し、得られた変数の中に、それぞれの病型で現在までに関連があると報告があった変数が含まれていることを確認した。なお、深層学習による分類とランダムフォレスト法による分類はほぼ同程度の分類性能を発揮することが確認されたため、学習器にランダムフォレスト法を選択した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の目標である、機械学習の学習結果を解析し、予測の責任変数セットとその寄与度を得る方法について検討を行い、HSIC-Lasso法とランダムフォレスト法を組み合わせることにより、目標が達成されたため。
|
今後の研究の推進方策 |
今後は、学習器の解析により得られた変数を、研究代表者が過去に開発した疾患オントロジーであるPre-eclampsia Ontology (PEO)や、ヒト表現形の解析や意味付けに広く利用されているHuman Phenotype Ontology (HPO)にマッピングし、変数間の直接的な関係性と、オントロジーのグラフを介した間接的な関係性の取得を検討する。本検討により、既存知識には関係があることが知られていない新たな関係性をあぶりだし、新規知識獲得を可能とする。
|
次年度使用額が生じた理由 |
次年度使用額は、今年度の研究を効率的に推進したことに伴い発生した。平成30年度請求額とあわせ、平成30年度の研究遂行に使用する予定である。
|