2003 Fiscal Year Annual Research Report
Project/Area Number |
15500088
|
Research Institution | Shinshu University |
Principal Investigator |
丸山 稔 信州大学, 工学部, 助教授 (80283232)
|
Keywords | SVM / RBF / 学習 / boosting / スパース化 / サンプリング / 画像認識 / パターン識別 |
Research Abstract |
本研究の目的は、例題からの学習手法を適用して、信頼度の高い識別関数を少数サンプルから動的に構築するための手法を確立することである。H15年度は、画像情報特に自然情景中の文字パターンを主たる対象として、RBFを識別関数として用い、高速・高精度な識別関数の動的構築手法に関する以下の研究を行い、その有効性を確認した。 ・仮想例題作成による識別能力の向上 与えられた対象を識別する2分識別関数を学習するためには十分な学習サンプルが必要になる。通常このとき非対象オブジェクトは対象オブジェクトよりもさらに多種多様であり、効果的なデータの提供が重要になる。本研究では、非対象オブジェクトの出現確率を考慮した学習データへの重み付けと、鏡像を用いた仮想データ生成による学習データ増強手法を検討し、提案手法により識別能力の向上が見られることを確認した。 ・スパース化による識別関数の高速化 本研究では識別関数としてはRBFを用い、学習方式としてはSVM(support vector machine)を用いている。これは良好な識別能力は有するものの、得られた識別関数は評価に時間を要する(遅い)という欠点がある。今年度は得られたsupport vector集合の中からk-means法を用いてごく少量のデータ点をサンプリングすることにより、さらにスパースなデータ集合を得て、これによって構築されるRBFの係数を元のSVMとの出力誤差を元データ上で評価した値が最小になるように決定する手法を考案した。文字パターン識別実験の結果、本手法によって識別能力はほぼ同等で識別速度は25倍以上の識別関数が得られることを確認した。 ・Boostingに基づくサンプリングによる識別関数の構築 上に述べた識別関数高速化をboostingを用いて実現するために、RBFの選択手法、データへの重み付け手法を考案し、文字パターン識別問題に適用した。実験の結果SVMを介して最適化を行う手法と同程度以上の識別能力と計算量を有するRBFの構築が可能であることを確認した。
|
Research Products
(1 results)