本年度は時系列データセットに含まれる時間パターンの種類数が未知な場合でも適用可能な教師なし時系列分節化手法の開発に取り組んだ.具体的には,ベータ過程自己回帰隠れマルコフモデルにベイズ階層言語モデルを組み合わせた手法を提案し,人工データによる検証も踏まえてその有効性を確認した.両手法ともノンパラメトリックベイズ法の一種であり,モデルの複雑さがデータに適応的に調節されるという特徴を有する.提案手法に類似した既存手法として,階層ディリクレ過程隠れマルコフモデルとベイズ階層言語モデルを組み合わせた手法が挙げられるが,提案手法はその手法より,とりわけ時系列データセット内の各時間パターンの出現頻度に不均一性が存在するような場合,優れたパフォーマンスを期待できる.そして,本年度の活動を通じて,時間パターンが複雑なものであっても,それが再現性良く反復して出現していれば,提案手法はその複雑なパターンをシンプルな自己回帰モデルによって表現される時間パターンを順に組み合わせることで表現した上で,特定できる可能性があることを示した.表面筋電図信号など,潜在するパターン数が未知の信号の時系列データに対しても分節化できる可能性がある.発話時の表面筋電図信号は,単語・音節という階層的な言語情報を反映していると考えられるため,その点でも提案手法のアプローチは有効,適切と考えられる.また,一方で,特段強い制約を仮定している手法ではないので,他分野への応用など汎用性も期待できる.
|