研究課題/領域番号 |
18H03266
|
研究機関 | 同志社大学 |
研究代表者 |
片桐 滋 同志社大学, 理工学部, 教授 (40396114)
|
研究分担者 |
中村 篤 名古屋市立大学, 大学院理学研究科, 教授 (50396206)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | パターン認識 / ベイズ境界 / 最小分類誤り確率状態 / 汎化問題 / 未知標本耐性 |
研究実績の概要 |
昨年度推進することを述べた高速なBBS(Bayes Boundary-ness-based optimal pattern classifier Selection)法を,旧来型のBBS法の10000倍程度にも及ぶ非常に高速な改良法として発表するに至った.これは,元々標本空間内で扱っていた各標本を,ほぼ「誤分類尺度」に相当する1次元空間に写像し,その空間内でパルツェン推定を用いて事後確率を求め,その事後確率を用いてベイズ境界性を推定する手法である.本手法に関しては,国際学会における発表を経て,現在論文誌に投稿中である. また,この新しいBBS法の開発に伴い,BBS法の高速化を目指して進めてきたMBB(Maximum Bayes Boundary-ness)法の性能を,改めて調査する必要がある.これまでの研究から,MBB法が,標本の事後確率が最大になるクラス境界を推定し得ることはほぼ明らかであるが,計算速度等に関して新しいBBS法と比較する必要がある.なお,このMBB法も新しいBBS法も,同じ誤分類尺度上への写像を経由していることから,新しいBBS法が圧倒的な速度向上をみたとしても,両者の間に根本的な差異はないように思われる.こうした点も考慮して,比較を行いたい. また,「パターン生成能力を直接反映する正則化」法を用いる音声認識の研究に関しては,そこで用いる正則化係数と合成音声の品質との間に,なんらかの関係があることが明らかになった.例えば,正則化係数が1.0のような時,音声の誤分類率が低くなり,かつその誤分類率は対象音声のベイズ誤り率にも近くなる.今後は,こうした正則化係数とベイズ誤りとの関係をより詳細に調べていく必要がある.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
国際誌論文として公表したBBS法の欠点,即ち「実行に長時間を要する」という性質が,およそ10000倍という圧倒的な高速化によって改善された.その結果は,国際会議論文として発表するに至った.この新しい手法の成果については,国際論文誌に投稿中であり,その中で,旧来の手法が持つ様々な要検討点に関する分析や改善法についても述べている.特に,種々のデータセットに対して得られた結果の詳細な解説や,用いられる計算が何故10000倍も圧縮されるか等に関する詳細な分析が行われている. また,BBS法の改良を目指して開発したMBB法については,現在種々のデータに対してほぼ期待通りの結果を得ている.今後,これらの結果をまとめて論文投稿を行う予定である. 「パターン生成能力を直接反映する正則化」法に関して,そこで用いている正則化係数によって上記で述べてきたベイズ誤り状態を推定し得ることがほぼ明らかになっている.今後は,この正則化がベイズ誤り状態の発見に及ぼす影響を分析し,その解明を進める予定である.
|
今後の研究の推進方策 |
ベイズ誤り状態を探索する手法は,必ずしも我々が開発したBBS法やMBB法,さらには正則化を経由した方法などには限定されないはずである.しかし,これまで示したように,開発した手法はいずれも,ベイズ誤り状態の極めて優れた推定手法として成り立っているように見受けられる. こうした中で,改良型BBS法の計算量に関する検討を続けるものの,BBS法そのものに関する検討はほぼ収束すべきものと考えている.むしろ,BBS法が示した「ベイズ境界を求めることの価値」の大きさを尊重し,その実際的な解を示すMBB法とパターン生成能力を直接反映する正則化法とが持つ,ベイズ境界推定能力の推定を着実に進めることとしたい. MBB法に関しては,10種類に及ぶ多数のデータベース上で評価実験を行い,その性能を明らかにし,論文化を行いたい.また,これまでMBB法(および改良BBS法)は,固定次元のベクトル標本のみを対象にして評価してきた.今後は,音声等の可変長パターンを対象にして,その有効性の検証も行っていく予定である.一方,正則化に関する手法は,音声のような可変長パターンのみを対象にして実験を行っており,今後は,固定次元パターンを用いた実験も行う予定である. こうして,MBB法も正則化を伴う手法も,扱うパターンの次元数の変動(単に次元数のみならず,固定長あるいは可変長かによる次元数の違い)によらない性質の有無を確認する予定である.なお,正則化を伴う手法においては,正則化係数がある一定の値になるときにベイズ誤りの優れた推定が行われ得ることがわかっており,今後は,その原因等を明らかにする必要がある.
|