1995 Fiscal Year Annual Research Report
確率・統計的手法による対話のモデル化とコーパスからの自動生成に関する研究
Project/Area Number |
07221209
|
Research Institution | The University of Tokushima |
Principal Investigator |
北 研二 徳島大学, 工学部, 助教授 (10243734)
|
Keywords | 対話モデル / コーパス / 隠れマルコフモデル / 状態マージング / ALERGIAアルゴリズム / オートマトン / 発話行為タイプ / 確率文脈自由文法 |
Research Abstract |
本研究では、確率・統計的手法に基づいた対話のモデル化について研究し、このような対話モデルを大規模言語データベースであるコーパスから自動的に生成するための研究を行なった。 まず第一に、学習データを幾つかのクラスタに分割し、各クラスタから確率文脈自由文法のパラメータを推定することにより、対話状況依存性を持つ確率文脈自由文法を構築する研究を行なった。IFT(Illocutionary Force Type;発話行為タイプ)付きの対話コーパスを用いた評価実験を行ない通常の確率文脈自由文法よりも優れていることを示した。 次に、IFT付きのコーパスから、話者の交替や質問・応答・確認といった会話の基本的な構造を確率・統計的にモデル化するための研究として、Ergodic HMMおよびALERIGIAアルゴリズムを用いた対話構造のモデル化について研究を行なった。Ergodic HMMによるモデル化では、質問・応答等の対話の基本構造を抽出することができ、話者ラベルとIFTを併用した場合には、状態遷移が事務局側の発話と質問者側の発話で比較的きれいに分かれたモデルが得られた。また、ALERGIAアルゴリズムにより得られるモデルは、決定性オートマトンであるため、エントロピーの小さなモデルを作成するためには、状態数を非常に大きくする必要があると分かった。
|
Research Products
(3 results)
-
[Publications] Kenji Kita: "Probabilistic Language Modeling Based on Mixture Probabilistic Context-Free Grammar" Proceedings of ROCLING VIII. 127-136 (1995)
-
[Publications] 北 研二: "発話タイプ付きコーパスを用いた確率的対話モデルの自動生成" 人工知能学会研究会. 47-54 (1996)
-
[Publications] 福井 義和: "確率・統計的手法による対話構造のモデル化" 情報処理学会研究会. (発表予定). (1996)