2017 Fiscal Year Research-status Report
肺音中の副雑音の分離技術と統計的モデル化手法を融合した肺疾患者識別手法の研究
Project/Area Number |
17K00408
|
Research Institution | Nagasaki University |
Principal Investigator |
松永 昭一 長崎大学, 工学研究科, 教授 (90380815)
|
Co-Investigator(Kenkyū-buntansha) |
酒井 智弥 長崎大学, 工学研究科, 准教授 (30345003)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 肺音 / 副雑音 / スパースモデル / HMM |
Outline of Annual Research Achievements |
従来の異常肺音の検出に関する研究では,統計的手法であるHMM (Hidden Markov Model、隠れマルコフモデル)を用いて正常肺音と副雑音を含む異常肺音との識別を行ってきた.これまでの研究では,異常肺音中に含まれる副雑音に関して,音響特徴の異なる断続性副雑音と連続性副雑音を区別して HMM を学習することが識別に有効であることを示してきたが,それぞれのモデルの学習データを十分に用意する必要があることや,聴診時に混入する雑音を副雑音と誤識別することで識別性能が低下することが課題であった.この課題を解決するために,本研究では聴診時に混入する雑音を事前に除去することにより識別性能を向上させることができると考えた.一方,共同研究者の酒井らは事前知識を用いた手法であるスパースモデリングによって肺音から断続性副雑音と連続性副雑音を分離できる例を示した.しかし,すべての肺音に対して有効であるわけではないという問題点があった.そこでスパースモデリングにより聴診音から連続性の音響特徴を持つ成分(具体的には呼吸音と連続性の副雑音)と断続性の特徴を持つ成分(具体的には断続性の副雑音や)副雑音として分離した二つの音信号を用いて異常音と正常音を識別することで、異常肺音検出を行うことを検討した. また、音響特徴パラメータにフィルタバンクの出力を用いて、深層学習により異常音と正常音を識別する方式について検討を開始した.これは従来の音響特徴パラメータであるMFCC(メルケプストラム係数)では断続性複雑音の検出では十分ではないと考えたためである.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
1)肺音の異常音と正常音の識別性能を向上させるための事前処理を手法として、スパースモデリングを用いる方式を検討した.聴診音をスパースモデリングにより連続性の音響特徴を持つ成分(時系列信号)と断続性の音響特徴を持つ成分(時系列信号)の二つに分離した.この分離の際に用いる音響特徴として、連続性としてはフーリエ成分を、断続性としてはウェーブレット成分を用いて分離を行う処理系を構築できた.次に、この処理系の評価方式として,それぞれの時系列信号に対して,連続性の副雑音区間及び断続性の副雑音区間に対して,分離前の原音(聴診音)と比較してどの程度のパワー値の変化が生じているかを測る処理系を構築した.この結果,連続性の音響特徴を持つ時系列信号では断続性の副雑音区間でのパワー値が大きく減少し,断続性の音響特徴を持つ時系列信号に対しては連続性の副雑音区間のパワー値が大きく減少し,スパースモデリングが聴診音を効率よく断続性の音と連続性の音に分離できることを示せた.一方で、スペクトグラムを詳しく調査すると断続音と連続音が分離できていない箇所(特に連続音の立ち上がり部分)があることがわかった.すべての肺音に最適なフーリエ成分とウェーブレット成分を定めることは難しいが,より最適な成分を決定する方式を検討しなければならないという課題が残った. 2)異常肺音と正常肺音の識別方式に関しては,分離した連続性の音響特徴を持つ成分(時系列信号)と断続性の音響特徴を持つ成分(時系列信号)の二つの扱い方に課題が残った.二つの信号系列を扱うことで連続性の副雑音と断続性の副雑音の分離精度は向上したものの,異常肺音と正常肺音の識別精度の向上は見られなかった.
|
Strategy for Future Research Activity |
1) 音響特徴パラメータに関して-----これまでの検討ではスパースモデリングにより連続性の音響特徴を持つ信号と断続性の音響特徴を持つ信号の二つに分離した.この二つを用いてHMMで学習と識別を行うが,この際にMFCCを音響特徴パラメータとして用いていた.しかし,MFCCでは断続性副雑音の音響特徴を十分に捉えられない可能性が高い.そのため,MFCCではなくフィルタバンクの出力をHMMのパラメータとして用いることにより識別性能の高性能化を検討する.また,次に深層学習(DNN)を用いて更なる性能の高度化を検討する.具体的にはフィルタバンクの出力をDNNの入力として用い,DNNの出力をHMMの入力として用いる.これにより,識別能力の高いパラメータを用いることを検討する. 2) スパースモデリングに関して-----多様な肺音に関して,連続性の音響特徴を持つ信号と断続性の音響特徴を持つ信号を効率よく分離できる,より最適なフーリエ成分とウェーブレット成分を決定する方式を検討する.また,断続性の音響特徴を持つ信号には元の聴診音に含まれている雑音が残されている.この雑音を取り除く手法を検討し,雑音に頑健な手法とする. 3) 識別方式に関して-----これまでは,スパースモデルを適用する前の聴診音を用いて正常音と異常音を分離し,その後,スパースモデルで分離した音に対して連続性副雑音と断続性副雑音の検出を行った.このため,識別処理が二段階となり処理量の増加を招いていた.そのため,この処理を軽減できる識別方式を検討する.またこの識別にはDNNを用いて,高精度な識別が可能な方式を構築する.
|
Causes of Carryover |
今年度の最も大きい支出はUbuntuワークステーションであった.これは深層学習を行うための高速計算GPUを保持するCPUを購入したものである.本来は、より高精度の計算を可能にするワークステーションを購入する予定であったが,申請予算が削減されたため、購入ができなくなり,処理性能を下げたGPUのワークステーションを購入せざるを得なくなった.また,旅費においては日当や宿泊費を下げ節約を行った.この次年度使用額は次年度の交付額と合わせて,計算能力の不足を補填できるワークステーションもしくはパソコンを購入予定である.
|