研究課題/領域番号 |
15KT0017
|
研究機関 | 大阪大学 |
研究代表者 |
高木 達也 大阪大学, 薬学研究科, 教授 (80144517)
|
研究分担者 |
日比 孝之 大阪大学, 情報科学研究科, 教授 (80181113) [辞退]
岡本 晃典 大阪大学, 薬学研究科, 招へい教員 (70437309)
川下 理日人 大阪大学, 薬学研究科, 助教 (00423111) [辞退]
|
研究期間 (年度) |
2015-07-10 – 2019-03-31
|
キーワード | 機械学習 / 有害事象 / 悪性症候群 / サポートベクターマシン / ランダムフォレスト / 多数決法 |
研究実績の概要 |
今回検討していた 7 種類の希少かつ重大な有害事象(皮膚粘膜眼症候群、中毒性表皮懐死融解症、横紋筋融解症、悪性症候群、白質脳症、可逆性後白質脳症症候群、QT延長症候群)中で、最も機械学習による予測に適した有害事象を探すために様々な機械学習法を用いて検証を行った。今回は、ロジスティック回帰 (LR) 、サポートベクターマシン (SVM) K近傍 (KNN) 法、決定木 (DT) 、ランダムフォレスト (RF)、勾配ブースティング (GB)、そしてそれらの手法による多数決 (MV) 法を用いた。 その結果、各手法におけるテストセット AUC 中央値がほぼ全ての手法で最も高い値を示したこと、そのときのテストセットの ACC も高いこと、混同行列を確認してもバランス良く正答していることから悪性症候群が対象有害事象のなかで最も良好な予測モデル(SVMで、AUC=0.8)を構築することができ、機械学習法を用いた予測モデル構築に適していることが確認できた。これは悪性症候群を引き起こした報告がある解析データの中に同じ作用のデータが多く存在しており、原因物質の化学構造が類似しているためであると考えられる。一方、悪性症候群以外の重大な有害事象の予測モデルでは精度の高い予測モデルは構築することができなかった。これは悪性症候群と比較して、有害事象発現の原因であると推定される医薬品の性質が幅広く、化学構造の特徴抽出が困難だったためであると考えられる。今後はそれらの有害事象についても予測精度を上げるためにフィンガープリント法などを用いて、更なる検討を行いたい。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初目的としていた7つの希少重大有害事象、皮膚粘膜眼症候群、中毒性表皮懐死融解症、横紋筋融解症、悪性症候群、白質脳症、可逆性後白質脳症症候群、QT延長症候群すべてについて、良好な予測モデルを構築することにはまだ成功していないが、悪性症候群に関しては、かなり良好な予測モデルを構築することができただけでなく、特に RNCG、SsssN といった化学記述子が悪性症候群に関連する可能性が示唆された。後者は、当初の予定より先を行っており、全体としてみた場合、おおむね順調に進展していると考えられる。即ち、初期の予定では、現在まで、2-3の希少重大有害事象に関して良好な予測モデルが構築できているが、その中身の検討はこれからというところであったが、良好な予測モデルは一つに留まっているものの、その中身の検討まで終えることができている。必要過程的には、ほぼ順調に推移しているといえる。
|
今後の研究の推進方策 |
今回の目的のためには、PMDAデータベースだけでは、良好な予測モデルの構築にはややデータ数が足りなかった。このため、米国安全食品局 (Food and Drug Administration: FDA) の有害事象データベース(FAERS)が存在する。このデータを追加することによって現状より詳細な解析が行うことができ、これまで予測が困難であった有害事象に関しても、良好に予測することができることが期待される。 また、化学記述子でなく、近年は、化学構造を細分化し、二値データに変換、一種の指紋のように扱うことで、化学構造をより細かく記述する手法が発達してきており(Fingerprint法)、この種の研究の入力データとして通例化している。この研究でも、Fingerprint法(特にNeural Fingerprint法)に焦点を移し、より細かな情報を得ることを目指すつもりで、既に準備にかかっている。 機械学習法としては、近年発達している深層学習(Deep Learning)も視野に入れ、種々の方法を試しつつ、最適な手法を探るだけでなく、一つの有害事象に関して得られた予測結果を新たな記述子とする当初の計画を試すことも考慮に入れている。
|
次年度使用額が生じた理由 |
現在までに使用した手法では、大量の計算機資源を必要とすることはなかったため、新たに大型計算機使用料を必要としなかったこと、国内で開催される学会で、適切な学会があったため、国際学会へ参加して発表する必要性があまりなかったことが主たる理由である(情報収集のためには国際学会に参加しており、平成29年度に、当該学会で発表する予定である)。ただし、今年度新たに請求した額よりは多くを使用している。
|
次年度使用額の使用計画 |
今年度は、国際学会で成果を発表する予定であり(AIMECS2017, Melbourne)、そのほか、Deep Learning(深層学習)に代表される、大量の計算機資源を要する手法と、大量の入力記述子を用いる手法(Neural Fingerprint 法)が控えており、大阪大学サイバーメディアセンターの高速計算機システムを利用する必要があり、その計算機使用料に充てたい。
|