研究課題/領域番号 |
15K08386
|
研究機関 | 北里大学 |
研究代表者 |
原 敦子 北里大学, 医学部, 講師 (10276123)
|
研究分担者 |
三枝 信 北里大学, 医学部, 教授 (00265711)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 病理診断報告書 / 病理組織標本 / テキストマイニング / 画像解析 / 病理診断支援システム |
研究実績の概要 |
「病理診断の客観化=数値化モデル」構築と「ITによる病理診断支援システム」開発というテーマの下、(1)病理診断報告書テキストと(2)標本画像を材料にして、科学研究費補助金を使用させていただき研究を行っております。平成27年度の概要は以下のとおりでございます。 (1)病理診断報告書テキストを用いた「病理診断の客観化=数値化モデル」構築→北里大学病院既存の病理診断報告書テキスト(乳腺疾患・胃疾患を使用)をテキストマイニング法等で解析し、疾患と報告書内キーワードとの論理的・医学的関係を抽出・数値化(=客観化)してデータベース(DB)化。新規報告書が与えられたら、DB内情報を元に統計解析や独自のアルゴリズムを用いて、報告書内の矛盾や記載ミスを提示するコンピュータ診断支援機能付与を行いました。なお本年度、このテキストに関する研究について、「病理診断報告書作成支援装置」として特許を取得しております(特願2013-244352)。 (2)病理組織標本を用いた「病理診断の客観化=数値化モデル」構築→バーチャルスライド装置によって得られた病理組織標本(乳腺疾患)電子化データを材料に、機械学習方式で解析・数値化(=客観化)し、画像解析による「客観的病理診断モデル」の構築を試みました。実際には、画像から各疾患特徴小画像を抽出→ウエーブレット変換およびクラスター分析を用いた訓練データ(数値化情報)生成・蓄積(DB化)→新規画像に対し訓練データとパターン認識→類似画像提示を行いました。その際、新規のパターン認識法選択(最近隣近傍法)や大量データ処理を可能とするためにビッグデータ関連の最新IT技術(分散処理)も応用しました。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
以下のように本研究はおおむね順調に進展していると考えます。 (1)病理診断報告書テキストを用いた「病理診断の客観化=数値化モデル」構築→従来から材料としている乳腺疾患に加え、今年度は新しく胃疾患の報告書テキストを材料に、テキストマイニング法等を用いてキーワード抽出と独自の辞書、プログラム作成、それを元にしたテキスト数値化とデータベース(DB)化を行いました。さらに新規報告書に対し、報告書内の矛盾や記載ミス等を提示する、主にダブルチェック・トリプルチェック時のスクリーニングに有用な診断支援機能を開発し、良好な結果が得られています。 (2) 病理組織標本を用いた「病理診断の客観化=数値化モデル」構築→訓練データとしてデータベースに蓄積した数は現在のところ約3万3千個強にのぼり、またビッグデータ関連の最新IT技術(分散処理)を用いることで解析速度のスピードアップが可能となりました。 ただし推定疾患確率の精度が低い疾患もあり、精度評価については今後の課題です。
|
今後の研究の推進方策 |
(1)病理診断報告書テキストを用いた「病理診断の客観化=数値化モデル」構築→引き続き同様の手法で、報告書内の矛盾や記載ミス等を提示する診断支援機能の精度向上を目指します。また対象臓器も増やす予定です。 (2) 病理組織標本を用いた「病理診断の客観化=数値化モデル」構築→引き続き同様の手法でクオリティー高い訓練データ蓄積増をはかり、高精度の推定疾患確率を目指していきます。また乳腺疾患のみでなく、今後は対象臓器も増やす予定です。 (3)さらに、上記(1)(2)の「客観的病理診断モデル」を連携・積極的に活用し、構築した病理診断支援機能(類似画像・推定疾患提示・記載ミスチェック機能等)を包括的に実装させた「コンピュータによる実用的病理診断支援システム(Computer Aided Diagnosis system)」開発を目指します。これは病理医が実際に行っている診断をシミュレーションする「ヒューリスティックなアルゴリズム」と「機械学習法等のアルゴリズム」の双方から複雑な病理診断をITで支援するものであり、「本支援システム」と「病理医自身が持つ高い診断能力」の相乗効果により、客観的・高再現性な診断根拠に基づく病理診断精度向上・診断の均霑化・生産性改善が期待され、患者への質の高い医療提供が可能となると考えます。
|
次年度使用額が生じた理由 |
病理組織標本を用いた「病理診断の客観化=数値化モデル」構築→画像電子化情報は膨大なデータであり、ビッグデータ関連の最新IT技術(分散処理)を用いて解析速度のスピードアップを図るも、その取り込みや解析に予想以上の時間・手間が掛かりました。そのため、今年度は乳腺疾患の他に対象臓器も増やす予定でしたが未だ進んでおらず、各臓器専用の画像解析コンピューターや画像・統計解析用既存ソフトウエア、大容量ハードディスク等が未購入であったことが次年度使用額が生じた大きな理由であります。
|
次年度使用額の使用計画 |
次年度では上記のとおり乳腺以外の臓器についての画像解析を進めていく予定であります。従いまして、①個人情報を扱う作業の性格から必要不可欠である画像解析専用コンピューター②画像・統計解析のための既存ソフトソフトウエア③大容量ハードディスク等の消耗品購入に使用させていただく所存でございます。
|