2012 Fiscal Year Research-status Report
動的輪郭モデルを用いたグラフベース半教師付き学習に関する研究
Project/Area Number |
24700170
|
Research Institution | Kyoto Institute of Technology |
Principal Investigator |
杜 偉薇 京都工芸繊維大学, 工芸科学研究科, 助教 (00512790)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Keywords | 半教師付き学習 / 動的輪郭モデル / 動的輪郭モデル初期値 / 動的輪郭モデルパラメータ |
Research Abstract |
本研究の目的はラベル情報の少ない、またはノイズが混入された学習データを利用して、大量のデータを分類することである。申請者はグラフベース半教師付き学習と動的輪郭のモデルを組み合わせることによって、データに含まれたノイズを削除し、少ないラベル情報を利用してラベルなしデータにラベルを付ける。この研究の目的を達成するため、平成24年度は計画通り、動的輪郭モデルの初期値、パラメータの検討を行った。 1.動的輪郭モデルの初期値を検討した。1.1.動的輪郭モデルの初期値をノイズではない、学習データのラベルとする。ラベルなしデータを参考にしなくても、ノイズを除去できるか検証した。1.2.1.1と同様に動的輪郭モデルの初期値をノイズではない、学習データのラベルとし、ラベルなしデータを参考にしながら、ノイズを除去できるか検証した。1.3.動的輪郭モデルの初期値をランダムに与え、ノイズを除去するため、ラベルなしデータを参照できるかどうか検証した。2.動的輪郭モデルのパラメータの検討は1.の各初期値の設定毎に、手動でパラメータを調整して最適な範囲を求めた。 このモデルの初期値とパラメータの設定は大量のデータを分類できるかどうかと直接に関連である。特にこのモデルの初期値とパラメータの範囲の設定、モデルの初期値と分類した結果、モデルのパラメータの範囲の設定と分類した結果の関連性がわかると、動的輪郭モデルとグラフベース半教師付き学習法を有効的に統合することができる。基礎的なグラフベース手法はノイズが混入されたデータに敏感や、不安定という欠点がある。一方、画像処理の分野で、動的輪郭モデルでの二階微分を行ったので、ノイズを有効的に削除できることが知られている。この動的輪郭モデルは学習データノイズの除去に有効であることは本研究の意義であると考えられる。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
ラベル情報の少ない学習データを利用して、大量のデータを分類することはパターン認識や機械学習における大きな課題である。実際の利用場面では学習データにノイズが混入するため、問題は更に難しくなる。本申請者はグラフベース半教師付き学習と動的輪郭モデルを組み合わせることによって、データに含まれるノイズを削除し、少ないラベル情報をラベルなしデータにラベルを付ける手法を提案する。 動的輪郭モデルは、内部エネルギーと外部エネルギーの和を最小にするように振る舞うモデルである。このモデルの初期値とパラメータの範囲の設定は難点であることがよく知られている。平成24年度、この初期値とパラメータの範囲の設定の検証を行った。 1.動的輪郭モデルの初期値の検討1.1.動的輪郭モデルの初期値をノイズではない、学習データのラベルとする。ラベルなしデータを参考にしなくても、ノイズを除去できるかは学習データのラベルの数とどの学習データにプロトタイプにするかと関連がある.それを確認した。1.2.1.1と同様に動的輪郭モデルの初期値をノイズではない、学習データのラベルとし、ラベルなしデータを参考にしながら、ノイズを除去できることを検討した。1.3.動的輪郭モデルの初期値をランダムに与え、ノイズを除去するため、ラベルなしデータを参照できることを検討した。以上の検討については基本的な考えがデータ分布図を描き、そのデータの分布に基づいて初期値の検討を行った。2.動的輪郭のモデルのパラメータの範囲の検討は1.の各初期値の設定毎に、手動でパラメータを調整して最適な範囲を求めたことであった。 平成24年度の計画は動的輪郭モデルの初期値とパラメータの範囲の検討なので、以上で、当初の計画以上に進展している。
|
Strategy for Future Research Activity |
本研究計画・方法では動的輪郭モデルを用いた半教師付き学習手法を提案・開発し、学習データに含まれたノイズを削除する。また、ラベルの付与されていないデータに正しいラベルを付けること。本手法を医用画像のベンチマークデータに対して応用して評価する。 平成24年度に、本手法の肝心になった動的輪郭モデルの初期値とパラメータを検討した。平成25年度に、動的輪郭モデルの初期値とパラメータを検討した結果に基づいて、グラフベース半教師付き学習と統合する。また、この手法の有効性に関してはよく使われるベンチマークデータであるBrainwebとthe Internet Brain Segmentation Repositoryに応用する。Brainwebは脳の2つの主成分(白質と灰白質)をかけられるかどうかの評価データ、IBSRは脳の32種類構造(白質、皮質、その内部のグレーの構造:海馬、尾状核、視床、被殻等)を分けられるかどうかの評価データである。この医用画像を用いて動的輪郭モデルのグラフベース半教師付き学習を利用する前に、画像のヒストグラムや、画素値などの情報を利用して画像の特徴量を抽出する前処理を行う。次に、学習データからランダムに少数のデータを選び、正解のラベルを付ける。提案手法の初期値とパラメータを設定し、学習データを分類する。得られた結果をROC曲線(受信者動作性曲線)で評価する。 以上が、今後の研究の推進方策である。
|
Expenditure Plans for the Next FY Research Funding |
該当なし。
|