研究概要 |
本年度は,前年度に行った脳の初期視覚を参考にした階層的な特徴抽出に基づく認識法を発展させ,近年,汎化能力の高い識別器として注目を集めているサポートベクターマシンに局所カーネルの導入を行った.局所カーネルという観点から従来手法を見ると,従来手法で頻繁に利用されている大局的Gaussianカーネルは局所Gaussianカーネルの積の特別な場合に一致することが分かる.積による統合は,1つの局所カーネルの出力値の変動に影響を受けやすい.具体的には,認識対象に部分的な隠れがある場合にはその影響を大きく受けてしまう.そこで,認識対象の局所領域に配置した局所カーネルの出力値を和で統合する方法を提案し,実環境下で問題となる部分的な隠れや光源方向の変化により生じる影にロバストな認識を実現した.この成果を画像の認識・理解シンポジウム(MIRU2004)及び国際会議(ICPR2004)で発表した. この方法をさらに発展させ,画像中から特定の種類の対象を探し出す対象検出の問題に適用した.この研究成果を情報技術フォーラム(FIT2004)及び国際会議(ICIP2004)で発表した. また,視覚情報だけから発話音声の認識を行うLip readingの問題にリカレントニューラルネットワークを適用し,従来手法と同等の性能が得られることを示した.この研究成果を国際会議(ICIAR2004)で発表した.
|