研究課題
本研究では、研究分担者(田邉)によって開発された確率的予測推論機械dual Penalized Logistic Regression Machine(dPLRM)を用いたマルチメディア異種混合データの判別予測方式を確立することを目的とする。本年度はdPLRMに関して1)大規模データの処理、2)複数の特徴量の扱い、3)時定数を異にするデータのコーディング、4)可変長データの処理の四つの項目について主に検討を行った。各項目の実績概要は次の通りである。1)大規模データの処理dPLRMの学習において大規模なデータセットを利用することを目的として、最尤基準に基づいてデータを選択的に用いるGreedy学習法を提案した。この方法により、数十万サンプル程度の学習データも扱えるようになった。2)複数の特徴量の扱い複数の特徴量を効果的に組合せることを目的として、dPLRMのマルチカーネル化を行った。音素識別実験において、このマルチカーネル化dPLRMにより複数の音響特徴量の中で有効なものを選択的に用いることができることを確かめた。3)時定数を異にするデータのコーディング映像検索のタスクにおいて、時定数を異にする画像とテキスト(音声認識結果、発声していない区間もある)を同時に扱うために、テキストに関する特徴量ベクトルに発声をしていないことを表す次元を付加するコーディング法を考案した。予備実験において、本コーディング法を用いて画像とテキストの特徴量ベクトルを一つに統合することにより、画像とテキストの組み合わせ効果が得られることを確認した。4)可変長データの処理異なる長さの時系列データを扱えるカーネル関数の設計を行った。dPLRMにそのカーネル関数を組み込み、孤立発声単語認識実験において効果を確かめた。
すべて 2007 2006
すべて 雑誌論文 (6件)
日本音響学会2007春季研究発表会講演論文集
ページ: 49-50
ページ: 51-52
Proceedings of 2006 IEEE International Conference on Acoustics, Speech, and Signal Processing I
ページ: 405-408
Proceeding of 7th NORDIC SIGNAL PROCESSING SYMPOSIUM
Proceedings of Interspeech 2006
ページ: 1690-1693
Proceeding of TRECVID 2006 Workshop