2021 Fiscal Year Research-status Report
Establishing a method for Automatic identification of Cervical Cancer Cells by a Deep Neural Network
Project/Area Number |
21K21320
|
Research Institution | Kyorin University |
Principal Investigator |
坪下 幸寛 杏林大学, 保健学部, 教授 (50910634)
|
Project Period (FY) |
2021-08-30 – 2023-03-31
|
Keywords | 深層学習 / 画像認識 / 子宮頸がん検診 / 細胞診 / 組織診 / 顕微鏡画像 |
Outline of Annual Research Achievements |
ヒト乳頭腫ウイルス (human papillomavirus: HPV) ワクチンの接種推奨が中止されている日本において、子宮頸がん患者の増加を抑える唯一の手段は、一次検診で上皮内病変を早期発見することである。一次検診はこれまで形態学的検査法の細胞診が担ってきたが、その感度はせいぜい70%(特異度90%)と指摘されており、その感度の低さが憂慮されて高感度(>90%)の遺伝子検査によるHPV検出法に変更する旨の指針案が提示された。しかし、HPV検出法は細胞診に比較して高価で特異度が低いため、一次検診法として採用には至っていない。 一方、深層学習(Deep Neural Network)は従来のシステムをはるかに凌駕する性能で、画像から対象物を検出・認識することができ、年々深層学習を使った新たな研究成果が多数報告されている。子宮頸がん検診で得られた細胞診標本に深層学習を適用し、専門技師の性能を凌駕することができるならば、従来まで問題とされてきた専門技師による細胞診の低感度問題が解決され、一次検診においてHPV検出法に代わる安価で正確な新しい子宮頸がん検診法の提供が可能となる。しかしながら、深層学習適用のために必要な分類が付与された細胞診顕微鏡標本の大規模なデータセットは存在しない。 そこで我々は、子宮頸がん検診で得られた細胞診標本にアノテーションを付与した大規模なデータセットの制作を行っている。現在、専門技師によるアノテーションが付与された画像数は1,181枚、患者数は246人となり、現時点でも細胞診のデータセットとしては世界有数の規模となった。 さらに、このデータセットを用いた深層学習による分類実験を実施した。ResNet34を用いて細胞診で得られた顕微鏡画像で組織診の診断を予測する実験を行ったところ、正確度 0.796、感度 0.723、特異度0.878となり専門技師の行う形態学検査の性能(感度0.7、特異度0.9)とほぼ匹敵する結果を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
学習データセットの作成は、1年目終了時点の予定2,000件に対して現在1,181件となっている。若干目標には到達していないものの、1年目にデータ作成手法が確立されており、作業者の習熟効果も考慮すると、十分に2年目の目標5,000件を間に合わすことができると考えている。また、モデルの開発、実験評価も概ね順調に推移しており、ベースモデルの確立と、感度70以上を達成することができた。
|
Strategy for Future Research Activity |
データセットの作成に関しては、2年目終了時点で5,000件のデータセットの作成完了を目指す。また、今後の細胞診関連の自動化技術の発展に寄与するため、データセットのオープン化についての議論を開始したい。また、深層学習モデルの開発に関しては、例えば、rotation invariance のモデルへの取り組みといったような、顕微鏡画像ならではの制約や特性を考慮した深層学習モデルの改良を行ってゆく予定である。
|
Causes of Carryover |
新型コロナウイルス感染症の蔓延防止のため、情報収集のための学会参加や共同研究者との会議の多くがリモートで行われたため、旅費負担がほぼなくなったため。
|
Research Products
(2 results)