研究概要 |
本研究では、研究分担者(田邉)によって開発された確率的予測推論機械dual Penalized Logistic Regression Machine (dPLRM)を用いたマルチメディア異種混合データの判別予測方式を確立することを目的とする。本年度は、昨年度に引き続いて音声データと、新たに聴覚系の神経発火パターンを対象として、dPLRMの判別予測性能を調査するとともに、帰納力に関する検討を行った。 音声データに関しては、テキスト独立型話者認識において、dPLRMの判別予測性能を混合ガウス分布モデルやサポートベクターマシンの性能と比較した。男性話者10名が複数時期に発声した学習用音声データを用いた比較実験において、dPLRMが最も高い性能を示した。dPLRMにより,時期差に頑健な話者特徴量が捉えられたと考えられる。 聴覚系の神経発火パターンに関しては、音源方向検出において、dPLRMの帰納力を利用した検討を行った。従来,音源方向は両耳の信号の間の相互相関に基づいて計算されてきた.人間の方向知覚に関するJefressの一致検出器モデル(時間遅れに応じた複数の検出器の並列に連結し,相互相関を検出するモデル)が,その発端の一つになっている.しかし,小型哺乳類においては,一致検出器の存在に疑問を呈する議論が生理データに基づいてなされている.本検討では、方向の異なるパルス音に対して,頭部伝達関数と内耳モデルを適用し,両耳の内耳出力(神経発火パターン)を模擬する.多数の訓練用データと正解方向から,1次の多項式カーネル関数を持つdPLRMに方向定位を帰納的に学習させ,テスト用データに対する方向の正解率で性能を評価する.その結果,dPLRMを用いれば,両耳信号間の相互相関を用いることなく,両耳信号の線形結合情報のみから音源方向を検出できる可能性があることを確かめた.
|