2014 Fiscal Year Annual Research Report
ノンパラメトリックベイズ理論に基づく生成的二重分節解析器
Project/Area Number |
24700233
|
Research Institution | Ritsumeikan University |
Principal Investigator |
谷口 忠大 立命館大学, 情報理工学部, 准教授 (80512251)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 確率的情報処理 / 時系列モデル / 言語獲得 / 記号創発 / ノンパラメトリックベイズ |
Outline of Annual Research Achievements |
本年度の研究では1.ノンパラメトリックベイズ理論に基づく生成的二重分節解析器の構築と実音声データへの適用,及び2.大規模自動車運転データへの適用を行った. 1.昨年度に定式化を行った二重分節解析器を計算機上に実装し,その有効性を検証した.これまでの二重分節解析器においては,出力素モデルと言語モデルを二段階で学習させていたが,この方法では実音声データのようにノイズの大きなデータに対しては,有効ではなかった.認識誤りが生じた時に,その後の単語区切りの推定の精度が致命的に低下する問題があった.本年度の研究を通じて構築したノンパラメトリックベイズ理論に基づく生成的二重分節解析器では,Backward-filtering forward samplingの技法により,直接,潜在単語をサンプリングするために,認識誤りを緩和することができる.日本語母音のみを用いた単語を複数準備し,これを日本語話者に話させることによって収集した音声データから,直接学習させることにより,既存手法を大きく上回る語彙獲得精度を出せることを示した. 2.これまで提案してきた二重分節解析器を大規模自動車運転データへ適用し,その有効性を示した.二重分節構造は音声データのみならず,自動車運転データや人間の動作系列に含まれる構造である.これを自動的に推定する二重分節解析器を用いて大規模自動車運転データの分析を行うことの有用性が示された.
|