2017 Fiscal Year Research-status Report
デジタル病理画像の機械学習による肺腺癌の予後予測モデルの構築
Project/Area Number |
17K08740
|
Research Institution | Kyoto University |
Principal Investigator |
吉澤 明彦 京都大学, 医学研究科, 准教授 (80378645)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 機械学習 / 肺腺癌 / 病理組織像 |
Outline of Annual Research Achievements |
肺腺癌の病理診断は、特徴的な5つの組織パターンを元に分類されているが(Comprehensive Histologic Subtyping: CHS)、その認識に関して客観性に問題があると言われている。本研究では、肺腺癌の病理組織標本をデジタル化し(Whole Slide Imaging:WSI)し、機械学習を用いて、より客観的で、予後を予測できるようなモデル(Computer-aided CHS: Ca-CHS))を構築することを目指す。 以下の進捗状況の記載にあるとおり,現段階では,倫理審査を通過し,基礎情報の収集,初期段階での検討を行っている。結果としては,20例という少数例の肺癌WSIを用いた検討では,アノテーション画像から抽出された小分画画像3万程度の画像をウエーブレット変換しクラスター分析しサポートベクターマシーン(SMV)にて検討したところ,訓練データに比し正解データで0.7772の正答率が得られている。問題点としては,アノテーションデータの偏りなどがあげられており,その偏りをなくす方向で訓練データを再作成,また増やし,検討を進めたいと考えている。また,ディープラーニング(DL)での検討も同様に行っているが,上記方法より正解率は劣っており(0.6028),ウエーブレット変換+クラスター分析Vと組み合わせた方法を検討している。 今後の方針としては,アノテーションの工夫,偏りのない画像の収集を行い,同様にウエーブレット変換しクラスター分析+SMVおよび,ウエーブレット変換しクラスター分析のうえで学習データを作成し,DLでの検討を進める予定である。また,精度の向上が達成した段階で(目標正解率0.95),訓練データとして,より多くのWSIを作成し,解析,構築されたCa-CHSを実際の臨床データとマッチさせ有用かどうかの検討に進む予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
以下のStepをすすめている 【検討前段階】当施設による倫理審査は終了。次に当施設における対象症例(1000例程度)の抽出,基本臨床情報(性別,年齢,手術方法,喫煙歴,ステージングなど)の収集とガラス標本でのCHSを含めた病理検討課題(浸潤型,脈管侵襲の有無など)の検討が終了。 【検討1】検討第一段階として,多重解像度解析・改良kNN法によるデジタル病理画像解析を進めるべく,対象症例を20例WSI化し,アノテーション(WSI中の腫瘍成分の領域の抽出,腫瘍成分中で各組織パターンの抽出)終了。まず,学習用のWSI画像を作成するために,非腫瘍成分を小区画化(128x128 pixel),ウエーブレット変換しクラスター分析で数値化(変数11個)した。次に,この小区画化した全30250を訓練データ20167,テストデータ10083として,サポートベクターマシーン(SVM)を用い,多重解像度解析したところ,0.7772の正答率が得られた。また,同じデータを用い,ディープラーニング(DL)により検討したところ,正答率は0.6028であった。問題点としては,訓練データに偏りが多く,バランスをもって訓練データを収集する必要があることがわかった。また,DLには大量の訓練データが必要となるが,ウエーブレット変換しクラスター分析し訓練データを作成した方が,DLでの精度向上に寄与する可能性が示唆された。
|
Strategy for Future Research Activity |
初年度検討では,症例の抽出,病理組織標本での基礎データの構築に大きな時間を裂いた。また,アノテーションツールとして,WSIスキャナメーカーのツールを用いていたが,非常に時間がかかっていた。そこで,国際コンペにも採用されているアノテーションツール(ASAP)にかえ,より簡便,詳細にアノテーションを行う手順が完成した。 今後は,検討1での結果をうけ,既存のWSIのアノテーション画像の作成に加え,偏りのない画像を収集,アノテーションし,同様にウエーブレット変換しクラスター分析+SMVおよび,ウエーブレット変換しクラスター分析のうえで学習データを作成し,DLでの検討を進めることにする。 また,精度の向上が達成した段階で(目標正解率0.95),訓練データとして,より多くのWSIを作成し,解析,構築されたComputer-aided CHSを実際の臨床データとマッチさせ有用かどうかを検討する。
|
Causes of Carryover |
平成29年度は,研究に資する試薬,書籍購入に加え,対象である肺癌分野で最も情報の集まる世界肺癌学会への参加,そしてデジタル画像解析用のPCの購入などに費用を用いてきた。現在,自施設にあるWSIスキャナで,対象である肺癌WSIを取り込み途中である。そういった大量の画像は,共同研究者(研究協力者)とのやりとりのためのSSDなどの可搬媒体購入や画像解析のためのソフトの購入が必要となるが,前述WSI取り込みが主体で平成29年度その購入まで至らなかった。平成30年度では,こういった備品に加え,併せて試薬や書籍などにも用いていく予定である。
|