研究領域 | スパースモデリングの深化と高次元データ駆動科学の創成 |
研究課題/領域番号 |
16H01542
|
研究機関 | 電気通信大学 |
研究代表者 |
庄野 逸 電気通信大学, 大学院情報理工学研究科, 教授 (50263231)
|
研究期間 (年度) |
2016-04-01 – 2018-03-31
|
キーワード | ディープラーニング / ディープコンボリューションネット / スパース特徴選択 / 温度交換MCMC法 |
研究実績の概要 |
本研究は医用画像等におけるテクスチャ解析を行うための枠組みをディープラーニングを用いて解析することを目的としている.研究プロジェクトの大枠としては,3つの課題からなり,課題1としてディープラーニングを用いた識別器の構築,課題2として従来から提案されている画像テクスチャを用いた識別器の構築,課題3としてこれらの二つの課題を繋げて,テクスチャ特徴量の比較を行い,医用画像の解析を行うためのテクスチャ特徴を検討していくという枠組みを考えている. 平成28年度に関しては課題1と課題2に関して研究を遂行した.課題1として,十分な能力の識別器を構築するためにディープラーニングを用いて識別器を構成した.ディープラーニングを用いる場合,十分な質と量のデータが必要となるが,医用画像においては,このようなデータを収集することが望めないことも多い.そこで,我々が以前から提案している転移学習を用いる手法をもちいて識別能力を向上させた.具体的には,大量の自然画像とテクスチャ画像などを情報源として事前に学習させることで,識別能力を向上させ,97%程度の識別精度を得ることに成功した. 課題2としては,従来の特徴量に対して,どのような特徴が識別に有効なのかを確認した.特徴量の選択問題は組合せ最適化問題として考えられ,貪欲法やスパース最適化,さらにマルコフ連鎖モンテカルロ法を用いたスパース選択といった手法が考えられる.ここでは,特徴量セットの分布といった観点から問題を捉えるため,列挙法として温度交換マルコフ連鎖モンテカルロ(MCMC)法を用いて,各テクスチャクラスに関して有効な特徴量のセットを抽出させた.結果として,課題1で求めたディープラーニングを用いた識別器には及ばないものの9割程度の精度を持つ,識別器を構成させることに成功した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度の研究課題として,課題1であるディープラーニングを用いたテクスチャ画像の識別器の構築に関しては,ディープコンボリューションニューラルネットワーク(DCNN) を用いて,実用に用いるのに十分な程度の識別精度を得ることに成功している.一方,課題2であるスパース特徴選択を用いたテクスチャデータの識別器構築に関しては,やや性能が劣るものの,各テクスチャクラスにおいて,9割程度の識別能力を持つ識別器を構築することに成功しており,どのテクスチャ特徴の組み合わせが有効であるかと言うところまでは理解の程度が進んだといえる.課題2において,調査しなければならないことは,スパース特徴選択手法である.L1 正則化を用いた識別器などと比較することであるがこちらも予備調査はほぼ終了している.
|
今後の研究の推進方策 |
平成29年度に関しては,上記の課題3に取り組む.課題3は課題1と課題2の結果の整合性を検討するプロジェクトである.課題1では,ディープコンボリューションニューラルネット (DCNN) を用いている.DCNNは,階層型のネットワーク構造を持ち,中間層では特徴表現を畳み込み演算を用いて表現している.一方,課題2で用いた,手法は,ハンドデザインされた特徴量の組み合わせから,識別精度が向上するものを選んでいる.テクスチャを識別するような課題の場合,どのような記述が有効かを選択することは難しい操作である.ディープラーニングを用いることは,この問題に関する一つの回答であるが,一定量の学習データを必要とするケースが多いため,こちらも解決しなければならない問題は多い. 本研究の課題3では,このような問題を視点に据えて,ディープラーニングで抽出している特徴がどのようなものか,また従来の特徴量とはどのように違うのかを調査することで新たな特徴量構成の為の指針とする.具体的にはDCNNの中間層の表現のうち,従来の特徴量とどの程度マッチングしているのかを調査する.課題1のDCNNでは,入力画像を特徴として分解して表現しており,このような特徴の組み合わせを階層的に行うことで最終的な特徴量を算出する.一方,課題2では,ハンドメイドの特徴量を直接選択し,識別器を構築している.そこで課題3では,課題2で選択している特徴量と,課題1のDCNNの中間層表現とがどの程度マッチしているのかを,回帰問題もしくは正準相関解析等で定式化を行い調査する.このような問題設定をおこなうことで,DCNN の中間表現にあって,ハンドメイドの特徴量では記述していない特徴量などを発見するのが狙いである.
|