2014 Fiscal Year Research-status Report
識別の根拠が提示できる高信頼メラノーマ自動識別システムの構築
Project/Area Number |
26461666
|
Research Institution | Hosei University |
Principal Investigator |
彌冨 仁 法政大学, 理工学部, 准教授 (10386336)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | メラノーマ / 自動診断 / deep learning / 機械学習 / 画像診断 |
Outline of Annual Research Achievements |
診断が難しく早期発見が極めて重要なメラノーマの自動診断技術開発に関して、その信頼性を高めるべく、診断の根拠が提示できるシステムの開発に向けた研究を実施してきた。目標実現をより確実なものにするため、当初の計画していた(1),(2)に加え、近年提案されてきた深層学習に基づく(3)を加え、大きく分けて以下の3つの内容について研究を実施した。 (1)臨床で用いられる診断指標を目的変数とした回帰モデルの作成:臨床現場で用いられるABCDルールや7-point checklistと呼ばれる計15の診断指標となる数値を画像から推定した。230枚の皮膚ダーモスコピー(皮膚科専用の診断用ルーペ)画像に対して、5人の皮膚科医が診断を行った結果を元に回帰モデルを構築した結果、各診断項目について統計的に皮膚科と同等の推定が行えた。 (2)RandomForest(RF)を用いた決定木の構築:識別モデルが木構造となり結論への根拠が直観的に把握できるRFを用いたメラノーマ識別器を構築した。従来の最良手法に匹敵する性能(8割後半)を実現したが、診断根拠の可読性向上のためにTreeの段数を制約した場合では識別精度は8割弱にとどまった。今後の改善が望まれる。 (3)Convolutional Neural Network(CNN)を応用した前処理不要な識別器の構築: 機械学習分野で近年高い注目を集めているCNNをメラノーマ識別に応用した。CNNは学習画像の中から識別のために必要な効果的な画像特徴を自動的に抽出し、識別に利用できるため、これまのパターン認識技術で必須であり困難であった腫瘍領域の抽出などの前処理を省略することができる。CNNの学習方法を独自に改良する手法を用いることで、前述の前処理や、特徴設計、抽出といった手法をすべて不要とした上で、従来の最前手法と同等の識別能(8割後半)を達成した。今後、メラノーマ識別の根拠にむけ、獲得された局所特徴の解析を行う。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
これまでの研究の下地の上に1年間の研究を実施することで、上記の(1)-(3)はいずれも数値上、目標値、あるいはそれに準ずる結果を実現することができた。一方で、構築するシステムは実用性、信頼性確保のため、より多くのデータに基づきロバストで普遍的なものでなければならない。そのため各項目に対する自己評価の達成度は、(1)80%、(2)60%、(3)50%としたい。 上記(1)では熟練皮膚科医と同等の診断指標の推定が実現でき、実施した手法の有効性が裏付けられたが、モデル構築の元となる教師データを得られた症例数が230にとどまった。これは教師データ作成にかかるコストが極めて高い(1症例ごとに複数の熟練皮膚科に大変手間のかかる仕事を依頼する必要があり、時間的負担が大きい)ためである。今後、時間をかけて解析できるデータ数を増加させ、より信頼性の高いモデルを構築する必要がある。 RFを用いた(2)についても、識別の根拠の提示を実現しているが、より可読性の高い根拠の提示には、より状況を説明できる高い普遍性を持つ説明変量(画像特徴)が必要であり、今後模索していく必要がある。現在、色補正技術との組み合わせで、少ない段数で明確な識別ルールの開示に向けて研究を続けている。 CNNを用いた(3)の手法は、当初の予定になかった新しい解析の試みであるが、学習方法の工夫により極めて高い識別精度を実現している。現時点では「診断の根拠」の提示には至っていないが、メラノーマの自動解析において極めて効果的な手法となる可能性が高く、大変期待できる手法である。学習後のCNNは識別のための局所パターンを獲得できるので、よい識別器が構築できた際には、これらパターンを客観的な診断指標として獲得することが期待できる。CNNの学習の結果得られる局所画像パターンは人の目にはわかりにくいが、機械を用いた学習器においては、効果的な特徴となりうる。今後さらに解析を進めていきたい。
|
Strategy for Future Research Activity |
昨年度1年間、大きく3つの独立した方策をとって研究を行ってきた。本年度も引き続き上記に記した課題の解決に向けて研究を進めていきたい。ここで(1),(2)で共通する根底に存在する課題である「識別のために必須となる特徴量の設計および抽出」は、これまでの一般的なパターン認識問題においても最大の問題でもある。これが(3)CNNの優れた学習機構と学習方法の工夫により、解決が期待できることが示唆された。本年度、(3)の手法についてより注力することで、CNNの学習により自動的に得られた診断のために重要な局所パターンを(2)の手法に導入することや、(1)の回帰モデルに相当する部分にCNNを応用するなどの手法も合わせて検討したい。 研究の推進には、皮膚科専門医との連携が不可欠である。特に汎用性に優れた識別器構築には、より多くの症例データならびに、それに付随する教師データ(診断、診断指標スコア)が必要である。今後も数多くの皮膚科医との信頼ある関係をより発展させながら研究を進めていきたい。また、これまでに得られた成果は順次、国内外の論文誌、国際会議、あるいは研究会で精力的に発表を行っていく。
|
Causes of Carryover |
旅費以外の項目は、ほぼ申請計画通りの執行となった。旅費に関しては研究の進捗、学事日程の都合により、申請時に予定した2つのIEEEの国際会議に年度内の参加ができず、代わりに別のIEEEの国際会議参加になったこと、また国内学会出張の旅費ならびに参加費を他の経費から支出できたことにより支出を圧縮できたため。
|
Expenditure Plan for Carryover Budget |
本年度(H27)、成果発表に必要な費用として利用する。また当初の予算総額の都合で購入を見送った、GPGPU搭載の並列計算機の購入を検討する。
|
Research Products
(7 results)