2006 Fiscal Year Annual Research Report
マルチメディア異種混合データの自動モデル選択による判別予測方式に関する研究
Project/Area Number |
16300036
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
松井 知子 統計数理研究所, モデリング研究系, 助教授 (10370090)
|
Co-Investigator(Kenkyū-buntansha) |
田邉 國士 早稲田大学, 理工学術院, 教授 (50000203)
|
Keywords | カーネルマシン / モデル選択 / 判別予測 / マルチメディア / 音声認識 / 話者認識 |
Research Abstract |
本研究では、研究分担者(田邉)によって開発された確率的予測推論機械dual Penalized Logistic Regression Machine(dPLRM)を用いたマルチメディア異種混合データの判別予測方式を確立することを目的とする。本年度はdPLRMに関して1)大規模データの処理、2)複数の特徴量の扱い、3)時定数を異にするデータのコーディング、4)可変長データの処理の四つの項目について主に検討を行った。各項目の実績概要は次の通りである。 1)大規模データの処理 dPLRMの学習において大規模なデータセットを利用することを目的として、最尤基準に基づいてデータを選択的に用いるGreedy学習法を提案した。この方法により、数十万サンプル程度の学習データも扱えるようになった。 2)複数の特徴量の扱い 複数の特徴量を効果的に組合せることを目的として、dPLRMのマルチカーネル化を行った。音素識別実験において、このマルチカーネル化dPLRMにより複数の音響特徴量の中で有効なものを選択的に用いることができることを確かめた。 3)時定数を異にするデータのコーディング 映像検索のタスクにおいて、時定数を異にする画像とテキスト(音声認識結果、発声していない区間もある)を同時に扱うために、テキストに関する特徴量ベクトルに発声をしていないことを表す次元を付加するコーディング法を考案した。予備実験において、本コーディング法を用いて画像とテキストの特徴量ベクトルを一つに統合することにより、画像とテキストの組み合わせ効果が得られることを確認した。 4)可変長データの処理 異なる長さの時系列データを扱えるカーネル関数の設計を行った。dPLRMにそのカーネル関数を組み込み、孤立発声単語認識実験において効果を確かめた。
|
Research Products
(6 results)