研究概要 |
(1)談話セグメント情報付与の基準の確立とデータの作成 ・異なる話者の応答関係,同一話者の継続関係という直観的にわかりやすい手がかりを利用した,談話セグメント情報付与の基準を確立した. ・この基準の信頼性を評価するために実験を行ない,素一致率約90%(κ値:約0.7強)を得た. ・この基準に基づいて,会議室スケジューリング対話36対話,旅行予約,旅行案内等の課題遂行対話28対話に,談話セグメント情報を付与した. (2)談話セグメント情報決定手法の検討 ・談話セグメントを自動的に決定するために,セグメント単位,類似性の手がかり,クラスタリング手法について実験を行ない,有効な手法を検討した. ・セグメント単位については,発話単位,談話行為単位,類似性の手がかりは,局所的手がかり(接続詞,感動詞などの品詞),大局的手かがり(単語,意味カテゴリの分布),クラスタリング手法については,トップダウン,ボトムアップ法について実験を行なった.さらに,拡張スケーリングによる最大エントロピー法を利用した手がかりの組み合わせについて実験を行なった. ・セグメント単位の選択により,大きく精度が変化すること,局所的手がかりが精度向上に,大局的手がかりが再現率向上に寄与することを明らかにした. ・最大エントロピー法を利用して手がかりの重みを学習し,10分割交差検定法により評価した詰果,再現率71.7%,精度54.2%で談話セグメントを決定できることを明らかにした.
|