1999 Fiscal Year Annual Research Report
談話情報を付与したコーパスを用いた音声対話処理の高度化に関する研究
Project/Area Number |
11480073
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
榑松 明 電気通信大学, 大学院・電気通信学研究科, 教授 (90251701)
|
Co-Investigator(Kenkyū-buntansha) |
伝 康晴 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (70291458)
山下 洋一 立命館大学, 理工学部, 助教授 (80174689)
荒木 雅弘 京都工芸繊維大学, 工芸学部, 助教授 (50252490)
中里 収 名桜大学, 国際学部, 講師 (90257197)
石崎 雅人 北陸先端科学技術大学院大学, 知識科学研究科, 助教授 (30303340)
|
Keywords | 音声対話コーパス / 課題逐行対話 / 談話タグ / 韻律情報 / 形態素情報 / 談話行為情報 / 談話セグメント情報 |
Research Abstract |
(9)研究業績の概要 本研究は,音声認識・言語処理・音声合成等の音声対話処理の要素技術における発話意図・話題等の談話情報の有効性を明らかにすることを目的にしている.複数の研究機関で収集されてきた課題遂行タイプの音声対話14対話(52分40秒)に対して,音声・転記データフォーマットの統一をはかるとともに,そのコーパスに対して,韻律,形態素,基本単位,談話行為,談話セグメントの情報を付与し、談話情報を付与した共有可能な研究用大規模音声対話コーパスを作成した.コーバスの情報の概要を以下に示す。 ・対話の種類:地図課題,クロスワードパズル,会議の予約,地理案内,テレフォンショッピング,会議室スケジューリング,写真を題材にした議論. ・音声:インターリーブ2チャンネル(符号付き2バイト・線形).左右チャンネルの同期. ・転記:漢字かな混じりの形式で記述.それぞれの単位の開始・終了時刻を付与. ・韻律情報:話者ごとに,10ミリ秒ごとの基本周波数・有声確率・パワーの値を抽出. ・形態素情報:形態素解析システム『茶筌』をもとに人手による修正を施して付与. ・基本単位情報:同一話者の発話において句点で区切ることができる区間または次の同一話者の発話に継続していない音声的連続を,人手により付与. ・談話行為情報:言語行為論,談話分析理論をベースにした談話行為付与マニュアルを基に人手付与. ・談話セグメント情報:談話セグメント理論をベースにした談話セグメント付与マニュアルを基に人手付与. このように作成したデータを利用して,対話システム作成の検討,韻律と談話セグメントの関係,韻律言語情報などと談話行為の関係の分析,あいづち,談話標識などの対話潤滑語の分析,セグメンテーションの自動化の研究を行なった.談話情報付与支援ツールに関しては,ヨーロッパにおける同様のプロジェクトのものを基本に初期検討を行なった.情報付与基準の作成・合意,作業の進行状況の確認,データの交換等を行なった.
|
-
[Publications] S.Itabashi,T.Itoh,H.Kashioka,K.Kato,H.Kikuchi,H.Koiso,T.Kumagai,A.Kurematsu,K.Maekawa,S.Nakazato,M.Tamoto,S.Tutiya,Y.Yamashita and T.Yoshimura: "Evaluation of Annotation Schemes for Japanese Discourse"Proc. of ACL '99 Workshop on Towards Standards and Tools for Discourse Tagging. ACL-WS'99. 26-34 (1999)
-
[Publications] 村井美智代,山下洋一: "音声対話に対する話題タグ付与における不一致分析"1999年度人工知能学会全国大会(第13回)論文集. 15-03. 225-228 (1999)
-
[Publications] Hiroaki Noguchi,Kazuhisa Kiriyama,Hiroshi Matsuda,Miki Taniguchi,Yasuharu Den & Yasuhiro Katagiri: "Automatic labeling of Japanese prosody using J-ToBI style description"Proceedings of the 6th European Conference on Speech Communication and Technology. 2259-2262 (1999)
-
[Publications] Akira Kurematsu,Atsusi Sukenori: "Language model selection based on the analysis of Japanese spontaneous speech database on travel arrangement"Proceedings of the 6th European Conference on Speech Communication and Technology. 2267-2270 (1999)
-
[Publications] 榑松 明,塩ノ谷陽介: "スケジューリングタスク自由会話データにおける発話意図の抽"人工知能学会研究会資料. SIGSLUD-9903-5. 25-30 (2000)
-
[Publications] 村井美智代,山下洋一: "談話セグメントと韻律との関係について"人工知能学会研究会資料. SIGSLUD-9903-7. 37-44 (2000)
-
[Publications] 野口 広彰,片桐 恭弘,伝 康晴: "あいづち挿入行動の実験的分析"人工知能学会研究会資料. SIGSLUD-9903-2. 7-12 (2000)
-
[Publications] 小椋 敦子,伝 康晴: "談話行為型の認識に役立つ言語情報の特定"人工知能学会研究会資料. SIGSLUD-9903-6. 31-36 (2000)
-
[Publications] 中里 収: "対話潤滑語の分析とその下位分類について"人工知能学会研究会資料. SIGSLUD-9903-10. 57-62 (2000)