2024 Fiscal Year Research-status Report
口腔細胞診の画像解析普及を目指したオープンデータセット構築と公開
| Project/Area Number |
21K11907
|
| Research Institution | Nihon University |
Principal Investigator |
末光 正昌 日本大学, 松戸歯学部, 講師 (10708770)
|
| Project Period (FY) |
2021-04-01 – 2026-03-31
|
| Keywords | オープン画像データセット / 細胞診 / 画像解析 |
| Outline of Annual Research Achievements |
病理検査の画像解析の更なる普及を目指すために、現在細胞診画像のオープンデータセットをウェブ上(https://oopid.jp/index.html)で公開中である。今年度は主として、公開中のデータセットの特徴を明らかにするために、核に主眼を置いて解析を行った。核所見は細胞判定を左右する重要な所見である。種々の核所見のうち、核の面積と濃染性を画像解析の手法を用いて明らかにし、Negative for intraepithelial lesion or malignancyで炎症のみられないもの(NILM [inf-])、NILMで炎症のみられるもの(NILM [inf+])、Oral low-grade squamous intraepithelial lesion or oral low-grade dysplasia(OLSIL)、Oral high-grade squamous intraepithelial lesion or oral high-grade dysplasia(OHSIL)、Squamous cell carcinoma(SCC)に分け比較した。また、二次元カーネル密度推定によりデータ分布を視覚化し比較した。その結果、核の面積はNILM[inf-]-OLSIL間以外の群間に統計学的有意差を認め、核の濃染性は、NILM[inf+]-OHSIL間、OLSIL-SCC間以外の群間に統計学的有意差を認めた。二次元カーネル密度推定によるグラフにおいても、分布の差異を確認できた。 一方、2024年度のオープンデータセットの利用状況については、ウェブサイトの訪問者が1日平均24人、ダウンロード数が1日平均約35回であった。昨年度と比較して、ダウンロード数及び訪問者数は増加傾向であった。しかし、渉猟しうる限り論文中への本データセット引用は認められなかった。
|
| Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
主となるデータセットの病理画像の撮影とデータセット構築は終了し、現在データセット(データセット名:OOPID-v1、手技:口腔剥離細胞診、部位:舌、解像度:1024x1024 pixels、パッチ数:9,593枚、データサイズ:17.1GB)をウェブ上(https://oopid.jp/index.html)で公開中である。 本データセットの利用について、データセット詳細が不明な場合、使用用途が限定されるため、データセットを構成する細胞像の画像解析を行い核所見の一部の特徴を明らかにした。本解析において、画像解析における関心領域の設定に非常に多くの時間を要した。従前口腔細胞像の画像解析では、細胞診専門歯科医が液晶タブレットを使用し、マニュアルトレース法にて関心領域の設定を行っていた。しかし9,593枚の画像をマニュアルトレース法で関心領域設定を行うことは困難であった。そこで、関心領域の設定方法を再検討し、その結果、adobe photoshopの自動選択ツールを補助的に使用し関心領域の設定を行った。これにより関心領域の設定に要する時間を1/3~1/4程度に削減でき、年度内に解析を終了し学会にて本データセットの特徴の一端の発表を行うことができた。 一方、利用状況については、ウェブサイト訪問者数やデータセットダウンロード数も増加傾向にあった。しかし、本データセットの使用を記載した論文は現時点で認められない。これについては、データセットサイズが大きいことと、パッチ数が多いことにより解析に時間を要することが影響していると考え、2025年度にこれに対応予定である。
|
| Strategy for Future Research Activity |
2025年度は最終年度となる。早急にデータセットの特徴の一端を明らかにした論文を学術雑誌に投稿予定である。尚、この論文の公開によりデータセット一端が明らかになりデータ利用が促されることと考えている。従って、オープンアクセス対応可能な学術雑誌への投稿を予定している。 一方、本データセットはファイルサイズが約17GBと大きいことが利用を足止めしている可能性がある。データサイズが大きい場合、ネットワーク環境が安定していない場合ダウンロードが中断する可能性がある。そこで、2025年度には、パッチサイズをへダウンサイジングした、データセットの軽量版を準備し、早々に公開を予定している。更に、データセットの分割ダウンロードの手配も行う予定である。 2024年度に解析していない細胞所見についても随時解析を加え、その詳細を報告予定である。 最後に、年度末には本データセットの利用状況を明らかにし、問題点を明らかにしたい。
|
| Causes of Carryover |
2024年度内の論文投稿が間に合わなかった為。2025年度の英文構成及び論文投稿料として使用予定である。
|