研究概要 |
音声対話では発話において助詞がしばしば省略される.また,助詞や助動詞といった付属語は,単語長が短く,音響的に曖昧になりやすいため,音声認識で誤認識や脱落が起きやすい.そのため,助詞は自立語と比べて認識精度が低い.これらの理由で,キーワードスポッティングなどの手法により,発話中の自立語のみで言語解析を行う研究が見られる. 従来の格解析は,格マ-カとして格助詞を検出し,その格助詞の情報を基にその句の格を決定するといった方法で行なわれてきた.しかし,音声認識からの結果は,しばしば助詞が脱落しているため解析が行なえない.そこで,本研究では,助詞の情報を利用せずに格解析を行なう手法として,コーパス内の動詞と名詞の共起関係から,その動詞に対する名詞の深層格を決定する方法を提案し,自立語列から格フレームを構成し,音声対話文の意味を理解することを目的とする. 本手法は,コーパスからの共起関係として,〈名詞,深層格,動詞〉の3つ組の共起関係を利用する.この自立語間の共起頻度を基にスコアづけし,最もスコアの高い深層格を得ることによって格解析を行なう.なお,コーパスを利用した統計的手法で問題となる.データのスパースネスの問題に対処するため,3つ組の共起関係がコーパス中に出現しない場合は,シソ-ラスを用いて「概念クラス」に対してスコアを与える. しかし,概念クラスに対してスコアを与えるようにしても,データのスパースネスの問題が完全に解消できるわけではない.一般に,データが非常にスパースな場合,スコアが得られる概念クラスがシソ-ラスのかなり上位に上がってしまい,スコアが係り名詞と深層格の間の関連性をほとんど反映しないものとなり,そのため,解析精度の低下を引き起こす可能性がある.そこで,〈名詞,深層格〉の2つ組の共起関係を利用した重みをスコアに加えることで,これを補う. 実験の結果,スコアに重みを加える手法の有効性が確認された.また,よりよい解析結果を得るためには,スコア全体に与える重みの強さを調整する必要があることも明らかになった.
|