2016 Fiscal Year Research-status Report
「病理診断の客観化=数値化モデル」構築と「ITによる病理診断支援システム」開発
Project/Area Number |
15K08386
|
Research Institution | Kitasato University |
Principal Investigator |
原 敦子 北里大学, 医学部, 講師 (10276123)
|
Co-Investigator(Kenkyū-buntansha) |
三枝 信 北里大学, 医学部, 教授 (00265711)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 病理診断報告書 / 病理組織標本 / テキストマイニング / 画像解析 / 病理診断支援システム |
Outline of Annual Research Achievements |
「病理診断の客観化=数値化モデル」構築と「ITによる病理診断支援システム」開発というテーマの下、1. 病理診断報告書テキストと2. 病理組織標本画像を材料にして、科学研究費補助金を使用させていただき研究を行っております。平成28年度の概要は以下のとおりです。 1. 病理診断報告書テキストを用いた「病理診断の客観化=数値化モデル」構築について (1)材料:北里大学病院既存の病理診断報告書テキストを用いました。本年度は、これまでの乳腺疾患・胃疾患に加え、大腸疾患および食道疾患も対象とし、扱う臓器数を増やしました。(2)方法:病理診断報告書をテキストマイニング法等で解析。疾患と報告書内キーワードとの論理的・医学的関係を抽出・数値化(=客観化)した後にデータベース(=辞書DB)化し、「病理診断書インスペクションプログラム」の構築を行いました。さらに新規報告書が与えられたら、DB内情報を元に統計解析や独自のアルゴリズムを用いて報告書内の矛盾や記載ミスを病理診断入力システムに提示する「病理診断支援装置」の開発を行いました。 2. 病理組織標本画像を用いた「病理診断の客観化=数値化モデル」構築について (1) 材料:北里大学病院既存の病理組織標本(浸潤性乳管癌症例)を用いました。(2)方法:バーチャルスライド装置によって組織標本電子化し小画像に分割後、ウエーブレット変換およびクラスター分析を行って学習データを作成しました。次に人工知能の研究手法を用いて学習モデルを作成しましたが、本年度は従来のkNN法と異なる深層学習法(フレームワークとしてはCaffe、OSとしてはLinuxを各々使用)を用いました。さらに新規症例が与えられたら、上記学習モデルに入力、画像を分類処理し推定疾患を提示する「病理診断支援装置」の開発を行いました。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
以下のように本研究はおおむね順調に進展していると考えます。 1.病理診断報告書テキストを用いた「病理診断の客観化=数値化モデル」構築 (1) 扱う疾患臓器が増えた点→乳腺疾患と胃疾患の生検材料に加え、大腸疾患および食道疾患の生検を追加しました。また乳腺・胃・大腸・食道の各手術材料の解析も可能となりました。(2) インスペクションプログラムで扱う項目が増えた点→診断名と所見内容との医学的な矛盾の指摘、日本語用語のチェックや英単語スペルミスチェック、正しい単語の候補の表示、手術材料で用いる記号(例:リンパ管侵襲、深達度など)のチェックが可能となり、上記4疾患については全ての報告書に対応できるようになりました。 2.病理組織標本画像を用いた「病理診断の客観化=数値化モデル」構築 (1) 新しい方法(深層学習法)での画像解析が可能となった点→画像解析については従来から人工知能の研究手法を用いて行っておりますが、本年度は新しく深層学習法(複数の隠れ層を持つ多層ニューラルネットワークを用いた機械学習法)を用いた解析が可能となりました。(2) 具体的には、乳癌を材料とし、「癌部と非癌部の認識」ならびに「浸潤性乳管癌の3つの亜型(乳頭腺管癌・充実腺管癌・硬癌)の鑑別」について検討したところ、従来用いていたkNN法よりも解析精度が上昇しました(深層学習法による正解率:83.9%、従来のkNN法による正解率:69.5%)。その他、人手が必要であった画像特徴抽出・分類などの作業が不要になった点、解析時間が従来の1/10と早くなった点が利点として挙げられます。
|
Strategy for Future Research Activity |
1.病理診断報告書テキストを用いた「病理診断の客観化=数値化モデル」構築 (1) 引き続き同様の手法で、報告書内の矛盾や記載ミス等を提示する「病理診断書インスペクションプログラム」の精度向上を目指します。その中でも辞書DB(データベース)の完成度がキーとなるので、癌取り扱い規約改定などに伴う新しい用語の追加をはじめとした臓器ごとの辞書カスタマイズやバグの対応法などを鋭意行っていく予定です。(2) また、これまでの4臓器(乳腺・胃・大腸・食道)に加え、対象臓器を増やす予定です。現在のところ、肺や婦人科疾患、悪性リンパ腫などを検討中です。 2.病理組織標本を用いた「病理診断の客観化=数値化モデル」構築 (1) 引き続き深層学習法を用いた画像解析を行う予定です。深層学習法では学習データの出来で精度が変わるため、今後はより質の高い学習データ蓄積増をはかり、解析精度向上を目指します。(2) またこれまでの乳腺疾患に加え、対象臓器も増やす予定です。現在のところ肺疾患を材料に、病理組織標本の選定やバーチャルスライドシステムを用いた標本の電子化、学習データ作成等について検討中です。 3. さらに、上記1,2の「客観的病理診断モデル」を連携・積極的に活用し、構築した病理診断支援機能(類似画像・推定疾患提示・記載ミスチェック機能等)を包括的に実装させた「コンピュータによる実用的病理診断支援システム(Computer Aided Diagnosis system)」開発を目指します。これは複雑な病理診断をITで支援するものであり、「本支援システム」と「病理医自身が持つ高い診断能力」の相乗効果により、客観的・高再現性な診断根拠に基づく病理診断精度向上・診断の均霑化・生産性改善が期待され、患者への質の高い医療提供が可能となると考えます。
|
Causes of Carryover |
病理組織標本を用いた「病理診断の客観化=数値化モデル」構築について 上記を行うにあたり、まずガラス上にある病理組織標本数百症例の、バーチャルスライドシステムを介した電子化が必要ですが、その情報量は膨大(ガラス一枚につき1~5GB程度)です。さらに実際の解析にあたっては、深層学習法などの新しい機械学習法を導入したり、ビッグデータ関連の最新IT技術を用いて解析速度のスピードアップを図るも、予想以上に膨大な時間・手間が掛かりました。そのため、乳腺疾患の他に対象臓器を増やす予定でしたが、平成28年度も未だ進んでいないのが現状です。以上の問題解決のためには、各臓器専用のハード容量の大きい画像解析コンピューターや画像・統計解析用ソフトウエア、大容量ハードディスク等の購入が必要ですが、これらが未購入であったことが、次年度使用額が生じた大きな理由と考えます。
|
Expenditure Plan for Carryover Budget |
次年度では上記のとおり乳腺以外の臓器についての画像解析を進めていく予定であります。従いまして、①個人情報を扱う作業の性格からも、各臓器専用でハード容量の大きい画像解析専用コンピューターの購入、②画像・統計解析のためのソフトソフトウエア購入、③大容量ハードディスク等の消耗品購入に使用したいと考えております。
|
Research Products
(2 results)