研究課題/領域番号 |
17K15866
|
研究機関 | 北海道大学 |
研究代表者 |
西本 尚樹 北海道大学, 大学病院, 特任准教授 (90599630)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 深層学習 / 仮想化技術 / 生物統計学 / 機械学習 / 臨床研究 / SDTM / ADaM / Lua |
研究実績の概要 |
研究計画当初に設定した3つの目標のうち、平成30年度では(2)及び(3)の情報ソースの構築を進めた。また、研究成果の実装によるfeasibilityを計測するため、コホート研究の付随研究として、電子カルテとEDCの技術的な連携をデザインし、CRCによる業務効率化の評価を行った。 (1)Semantic integration技術:HL7/SS-MIX2データに対するメタデータの構築を行う (2)深層学習:変換パターンの分類とプログラミング言語による処理コーディングを行う (3)現状のマッピング割合24%から20%以上上乗せした変換割合向上を目指す。 2018年6月に研究拠点を香川大学医学部附属病院から、北海道大学病院臨床研究開発センター生物統計部門に移したが、香川大学医療情報部の研究チームと研究体制を継続し、HL7/SS-MIX2形式のデータ利用に関する論文の執筆を進めている。これまでの臨床研究及び医療用語研究の成果をもとに、SASのProc Lua(プログラミング言語LuaのSAS移植版)を用いて、解析用コードの自動生成環境を構築した。また、深層学習を組み合わせた臨床データとCDISC SDTMの連結可能性を明らかにするために、深層学習の利用環境として、Linuxサーバー上に仮想環境の構築およびプログラミング言語Pythonおよび、Chainerのインストールを行った。引き続き、香川大学医学部附属病院で治療を行った330名のくも膜下出血患者の臨床データを解析し、治験では規制当局(PMDA)への提出データフォーマットとして採用されているCDISC SDTMの変数名への対応付け、及び解析用データセットADaMへの変換可能性を調査した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
医学用語のコード化を行うために、医学用語辞書及び機械可読の辞書の整備を行っているが、教科書に記載されている用語の表記ゆれとCDISC controlled terminologyとの相違により、完全なマッピングができないため、中間コードの生成に時間を要している。しかし、これらも SASデータセットとLua procedureを用いて解析用コードの自動生成を行っており、2019年度中に解決できるものと考えている。 また、深層学習については、workstationを北海道大学病院に移管できなかったため、北海道大学で採用されているスーパーコンピュータの利用を検討している。開発環境は、プログラミング言語PythonおよびChainerを用いる。 引き続き、香川大学医学部附属病院で治療を行った330名のくも膜下出血患者の臨床データを解析し、治験では規制当局(PMDA)への提出データフォーマットとして採用されているCDISC SDTMの変数名への対応付け、及び解析用データセットADaMへの変換可能性を論文化する。
|
今後の研究の推進方策 |
北海道大学病院臨床研究開発センターでの治験データ解析において、多くの知見が積み上げられている。特に帳票作成の自動化には、技術的な加速化の要素が大きい。本研究では、医学用語のコード化に時間を要しているが、通常のプログラミン言語よりもデータ解析や帳票出力に強いSASを用いることで、大きな進展が見込まれる。具体的には、帳票フォーマットからSASコードを自動生成する仕組みを導入することで、コンピュータアルゴリズムによる自動的な対応付けと、人手による修正の大幅な効率化があげられる。また、SASにおけるLua procedureは、プログラミング言語LuaをSASに移植したものであるが、組み込み言語としての特性を兼ね備えており、高速に動作するため、巨大なデータセットであっても、アルゴリズムは実行可能である。北海道大学で採用されているスーパーコンピュータの利用を検討している。開発環境は、プログラミング言語PythonおよびChainerを用いる。臨床データの解析として引き続き、香川大学医学部附属病院で治療を行った330名のくも膜下出血患者の臨床データを解析し、解析用データセットADaMへの変換可能性を論文化する。
|
次年度使用額が生じた理由 |
次年度使用額が生じた理由としては、香川大学から北海道大学病院に異動した際に、ディープラーニングを行うための計算用ワークステーションを移管できず、機器の再選定を余儀なくされ、その選定に時間がかかり、当該年度では購入できなかった。2019年度においてワークステーションの購入及びGPUの増設を図り、深層学習の環境を再構築して臨む。
|