2013 Fiscal Year Research-status Report
ノンパラメトリックベイズ理論に基づく生成的二重分節解析器
Project/Area Number |
24700233
|
Research Institution | Ritsumeikan University |
Principal Investigator |
谷口 忠大 立命館大学, 情報理工学部, 准教授 (80512251)
|
Keywords | 機械学習 / ノンパラメトリックベイズ / 時系列解析 |
Research Abstract |
本年度は本研究課題の基幹である1.二重分節解析器のモデル開発 と2.当該モデルに関する効率的なサンプリング手法の開発を行った.また,3.二重分節解析器の実データへの適用と応用に関する研究を行った. 1.二重分節解析器のモデル開発:本年度の研究では,これまでの二重分節解析器においては,二段階で学習させていた出力素モデル(音素・動素モデルに対応)と,言語モデルの学習を一体的な生成モデルのもとで定式化を行った.単語が言語モデルより生成され,それに属する各隠れ状態が,一定の自己遷移確率と次の文字への遷移確率を持つという生成モデルを作成し,この数学的な定式化を行った. 2.当該モデルに関する効率的なサンプリング手法の開発:基本的なアイデアとしては,当初の計画通り,部分時系列情報に対するforward-filtering backward sampling の手法を適用することによって二重分節解析器の効率的なサンプリング手法の開発を行った.全体としてBlocked Gibbs sampler となる学習・推定手法を開発することが出来た.しかし,対象の問題自体が本質的に巨大なものであり,計算量は実用に耐えるレベルまで効率化を行うことは出来なかった.計算量の削減や計算の並列化は次年度の課題である. 3.二重分節解析器の実データへの適用と応用:二重分節解析器を予測モデルに拡張し,自動車運転データへと適用した.また,トピックモデルと融合させることで,自動車運転データのトピック解析の性能を向上させた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度に多少の遅延がみられたが,当初の計画におけるモデル構築の手順ではなく,より直接的に二重分節解析器の導出が可能であることがわかり,二年度目の実施においては,当初の目的を達成する事ができた.
|
Strategy for Future Research Activity |
研究提案に示したとおり1.人間の非分節動作時系列データからの単位動作抽出に対する有効性の検証,2.ラベル付けされていない音声データからの語彙獲得に対する有効性の検証,3.より計算コストの安価な学習アルゴリズムの開発,を行っていく. 1.人間の非分節動作時系列データからの単位動作抽出に対する有効性の検証:人間の動作系列の観察を通して自動的に動作を獲得するロボットを開発する.具体的には区切らない人間の動作系列をモーションキャプチャにより観測し,この時系列データに対して,二重分節解析器を適用することで,単位動作を獲得する,ロボットを開発する. 2.ラベル付けされていない音声データからの語彙獲得に対する有効性の検証:実音声発話から自動的に単語を獲得するロボットの開発の為の実装を行う.乳幼児の言語獲得過程では,音素モデルも言語モデルも存在を仮定できない.これまで成人の音声発話を対象とした音声認識研究とは異なり,ラベルをつけたコーパスを前提とせず,発声データを用いて,自動的にこれらから語彙と文法規則を推定する実験も行う. 3.より計算コストの安価な学習アルゴリズムの開発:本年度開発した二重分節解析器は大規模データに対して対応できるほど計算効率的であるとは言いがたい.最終年度では可能な近似や,並列化も考慮にいれ,実用上利用可能な範囲での計算時間の高速化も検討する.
|
Expenditure Plans for the Next FY Research Funding |
国際会議への論文投稿が一件採択されず,出張を一件とりやめたため. 当該内容は,内容をより充実したものとして投稿後,採択済みであるので,本年度執行予定である.
|