研究概要 |
人間が対象物体を指示する時に用いる参照表現を計算機で扱うモデルを構築するための基礎データとして,日本語の参照表現コーパスを作成した. 2名で幾何パズルを協調して解く課題を与え,その時の対話音声,パズル・ピースの位置,パズル・ピースに対する操作,および対話者の視線などの情報をすべて時間同期して記録した.対話音声を書き起し,その中から参照表現を抽出し,指示対象と表現中の性質をアノテーションし,合計131対話からなるマルチモーダル・コーパスを作成した.このコーパスを基礎データとし,視線や行動などの非言語情報を利用した参照表現の理解・生成モデルを機械学習の枠組を用いて実現した.作成したコーパスを用いてこれらのモデルの評価をおこない,その有効性を確認した.
|