2018 Fiscal Year Research-status Report
デジタル病理画像の機械学習による肺腺癌の予後予測モデルの構築
Project/Area Number |
17K08740
|
Research Institution | Kyoto University |
Principal Investigator |
吉澤 明彦 京都大学, 医学研究科, 准教授 (80378645)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 機械学習 / 肺腺癌 / 病理組織像 |
Outline of Annual Research Achievements |
研究の目的:肺腺癌の病理診断は、特徴的な5つの組織パターンを元に分類されているが(Comprehensive Histologic Subtyping: CHS)、その認識に関しては客観性に問題があると言われている。本研究では、肺腺癌の病理組織標本をデジタル化し(Whole Slide Imaging:WSI)し、機械学習を用いて、より客観的で、予後を予測できるようなモデル(Computer-aided CHS: Ca-CHS))を構築することを目指す。 研究実施計画:2017年度は,研究倫理申請,WSIの取り込み,情報収集を行ったのち,20例の肺腺癌切除材料から撮影したWSIを用いて検討を行った。基本的に5つの組織パターンでセグメンテーション(アノテーション)した画像から,小分画画像3万程度の画像を抽出,ウエーブレット変換しクラスター分析,サポートベクターマシーン(SMV)にて検討したところ,訓練データに比し0.7772の正答率が得られた。問題点としては,アノテーションデータの偏りなどがあげられており,その偏りをなくす方向で学習データを再作成,あるいは増やし,検討を進めることとした。しかしながら,テストデータ(未アノテーション画像)では十分な結果が得られなかった。アノテーション画像の量が少なかった可能性もあるが,2018年度は,検討手法を,SVMから機械学習の一つである畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)もあわせ検討を行うこととした。以下「現在までの研究進捗状況」に詳細を記載する。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度(2018年度)は,2017年度の経験を踏まえ,ウエーブレット変換+クラスター分析と組み合わせた方法を検討した。肺腺癌の各パターン(T01-T10)のアノテーションを行いそこから,20788枚のパッチ画像を抽出,その2/3を学習データとし,1/3をテストデータとして前述の方法で検討した。総合正答率は0.892であった。誤ったものを抽出し検討してみると,乳頭型,腺房型の分類,あるいは乳頭型,微小乳頭型の分類が十分でないことが分かった。また,この検討を未アノテーション画像で検討したところ,十分な結果が得られなかった。そこで,機械学習の別の方法として,畳み込みニューラルネットワーク(CNN)を用いた検討を行った。前述データセットからパッチ画像を抽出,様々なネットワーク(U-net, SegNet, Dilated-Net, DeepLabv3+, Hrd-Switch-CNN)で計測したところ,多クラスでの正解率は画像の倍率5倍,10倍,20倍)ごとにことなり,すなわち0.577, 0.552, 0.495であった。病理判定(パターンのクラス分け)は比較的低拡大で行う傾向があるが,パターンによっては拡大をあげて検索していることが原因と考えられた。そこで,画像に応じてどの視野を活用するかを判断して複数視野を統合する方法(adaptively weighting multi-field-of-view CNN)を考案,多クラス解析では,既存ネットワークでのoverall pixcel accuracy (OPa)が,0.433-0.625であったのに対し,考案法では,0.641と改善がみられた。
|
Strategy for Future Research Activity |
多クラス分類の困難さは病理判定としても難しい部分がある。実際問題として,各パターンの完全一致を目指すのではなく予後に影響するパターンを絞ってクラス分けを行い,CNNおよび提案法にて,より精度の高いネットワークの創出を目指す。 また,研究申請時には予想されていなかった,免疫チェックポイント阻害剤利用が実臨床に導入された。この阻害時を用いるためにはバイオマーカーとしてPD-L1の免疫染色が病理医が判定するようになったが,本検討の応用として,そういったバイオマーカーの標準化に寄与するようなネットワークの創出に関しても検討を行う。 また,既存医療情報に加え分子生物学的な観点での情報を加味し,検討を進める予定である。
|
Causes of Carryover |
昨年秋(2018年10月)に本検討に類似した画像解析課題がNature medicine誌に掲載された。収集している医療情報としては,本検討の方が勝っていたが,前述論文では分子生物学的な観点からのデータを含めたものであった。2019年度予算としては,これまでに開発されたadaptively weighting multi-field-of-view CNNを用い,さらに多くの画像で学習したデータで,予後予想を行えるアーキテクチャを創出していく予定であるが,データとしてこれまでの症例で分子生物学的な内容を加えるべく,そのための試薬を計上していく予定である。 また,2019年度でも,研究成果発表のため,海外学会への参加を考え,その渡航費を40万ほど計上する予定である。また,論文執筆のための予算も計上する。
|