2007 Fiscal Year Annual Research Report
会議データトランスクリプトの半自動生成とトランスクリプトの分析
Project/Area Number |
19800015
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
市野 順子 The University of Electro-Communications, 大学院・情報システム学研究科, 助教 (50452040)
|
Keywords | 会議データ / トランスクリプト / 発話行動データ / 韻律情報 / 話者交替情報 |
Research Abstract |
本研究の全体構想は、会議を知識ではなくコミュニケーションの側面からとらえ、会議進行中ダイナミックに変化するコミュニケーション形態に柔軟に適応する支援環境を構築することである。この全体構想を踏まえた本研究の具体的な目的は、会議データのトランスクリプト(会話や動作の記録)の半自動生成およびコミュニケーション行為としての会議データトランスクリプトの分析である。 初年度である本年度は、1.本年度は発話に関する行動データを収集し、2.発話データのトランスクリプトの半自動生成を行った。 1.発話に関する行動データの収集 ダイナミックに変化する会議に含まれる様々なコミュニケーション行動データのうち、まず発話行動に注目した。4人1組による模擬会議を複数回行った。全員にマイクを装着してもらい各メンバの発話を収録した。課題として,オンラインストアのウェブサイト画面の原案に対して「利用者が違って注文することのない画面」になるようにグループで相談しながら改善する課題を用意した.グループでの議論を前半と後半に分け,前半ではメンバの改善案を出し合い,発散段階の議論を行ってもらった。後半では,前半で出された各改善案の中から最適な案を3つ選定する収束段階の議論を行ってもらった. 2.発話データのトランスクリプトの半自動生成 会議をコミュニケーションの観点から分析するためには、行動データを記述する必要がある。1で収録した発話行動データについて(1)話者交替情報、(2)韻律情報、(3)発話内容、を自動抽出するシステムを構築した。 (1)話者交替情報:発話時間、話者交替状況(話者交替、話者維持、沈黙、発話重複)の出現頻度、発話回数など (2)韻律情報:声の高さ、声の大きさ、発話速度、発話時間長、発話中のポーズ回数)など (3)発話内容(発話内容を完全に書き起こすことは、既存の音声認識技術では不可能であるがある程度は可能。)
|