研究課題/領域番号 |
08837004
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
談話(ディスコース)
|
研究機関 | 千葉大学 |
研究代表者 |
土屋 俊 千葉大学, 文学部, 教授 (50155404)
|
研究期間 (年度) |
1996 – 1997
|
研究課題ステータス |
完了 (1997年度)
|
配分額 *注記 |
2,400千円 (直接経費: 2,400千円)
1997年度: 800千円 (直接経費: 800千円)
1996年度: 1,600千円 (直接経費: 1,600千円)
|
キーワード | 談話 / 対話 / マークアップ / 談話構造 / セグメンテーション / SGML / TEI / ターンテ-キング |
研究概要 |
本研究は、音声対話を記録、保存、交換するために必要な手法を、マークアップ(タグ)を中心にして検討することを目的にしている。今年度の研究では、とくに、音声対話研究の基礎となる言語資料(コーパス)が備えるべき性質について検討を加え、それに基づいてタグセットを規定し、音声対話コーパスのプロトタイプを作成した。 音声対話コーパスは3つまたは4つの部分からなる。第一の部分は、音声ファイルであり、これは、対話に参加する2人の話し手の発っした音声が分離して再生することができる形でエンコードするものである。また、発話の生起の時間的関係が明示できなければならない。第二の部分は、映像ファイルであるが、この部分は、現在の技術的レベルでは出来事を完全に再生するものではないので(パースペクティブがあるため)、かならずしも必須の部分ではない。第三の部分は、「アノテーション」であり、ここで音声による出来事とて特定された事件に対するコメントがつけられる。コメントの種類には、正書法転記テキスト、言語タグ、談話タグが含まれる。とくに転記テキストを「アノテーション」の一種とみなすことは、談話などのレベルでの情報を交換するという観点からは不可欠なことであることを示すことができた。 これらのタグセットをTEIの規定する方式で定義して、それを利用して128対話からなる地図課題対話コーパスを整理し、公開が可能な厳密性を検証した。あわせて、これらの交換形式を持つ音声対話コーパスを作成するためのガイドラインを提案した。
|