2002 Fiscal Year Annual Research Report
Project/Area Number |
12132205
|
Research Institution | Waseda University |
Principal Investigator |
小林 哲則 早稲田大学, 理工学部, 教授 (30162001)
|
Co-Investigator(Kenkyū-buntansha) |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
菊池 英明 早稲田大学, 人間科学部, 講師
白井 克彦 早稲田大学, 理工学部, 教授 (10063702)
匂坂 芳典 早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)
甲斐 充彦 静岡大学, 工学部, 助教授 (60283496)
|
Keywords | 音声対話システム / 韻律 / ターンテーキング |
Research Abstract |
対話時韻律制御のモデルによって,自然な対話のリズムを実現するとともに,高度な対話理解を可能にすることを目標とし,以下の検討を行った。 a)対話のリズムと韻律制御:分類決定木の手法を用いて,あいづち・発話交代などのタイミングをモデル化し,プロトタイプシステムとして実装を行った。また,談話構造の明確化,感情伝達,心理状態の表現の3点から韻律の役割を検討した。 b)対話理解応用:連続する2発話間の音響・韻律的な変化を用いて,誤り訂正発話を検出することについて検討した。現状では,30から40%程度の検出ミスと,過剰検出率となっている。また,別途ワードスポッティングによる手法について実装した。今後両者の併用について検討する予定である。 c)対話音声合成応用:文単位で発話された音声における、音韻の時間長変形に起因する自然性の劣化を聴覚的に評価する実験を行った。ある文節に注目すると,文節頭、文節中、文節末の順に音韻長伸縮に対する許容度低下が大きいことがわかった。また,この傾向は文中、文節単独の発話の両方の場合で見られること,呼気段落といった音響的境界よりも文節という言語区分の方が音韻長知覚に影響を与えることも分かった。 d)対話システム:前年度までに作成した,韻律利用対話システムのプロトタイプの高速化について検討した。本システムは,即時配信機能付の黒板システムを高速内部バスとネットワークバスの2層構造で実現するアーキテクチャを設計・実装し,応答速度において多様な要求仕様を持つモジュール群に対応可能なシステムを実現した。 e)対話コーパス:昨年度収集した,分節音・韻律・談話のラベルを持つ対話コーパスに,発話者の心的態度のタグを追加した。
|
Research Products
(14 results)
-
[Publications] 竹内真士, 北岡教英, 中川聖一: "韻律・言語情報を素性とした決定木による自然な応答生成タイミングの検出"日本音響学会講演論文集. 2-4-9. 75-76 (2003)
-
[Publications] 籠宮隆之, 五十嵐陽介, 菊池英明, 米山聖子, 前川喜久雄: "自発音声コーパスにおけるFO下降開始点位置の分析"音響学会春季研究発表会講演論文集. 317-318 (2003)
-
[Publications] 近藤 亜希, 前木 大樹, 内藤 拓郎, 白井 克彦, 匂坂 芳典: "日本人発話英語のリズム客観評価モデル"音響学会春季研究発表会講演論文集. 3-6-13. 353-354 (2003)
-
[Publications] 前木 大樹, 内藤 拓郎, 近藤 亜希, 白井 克彦, 匂坂 芳典: "英語発話リズム客観評価に向けた音響特徴の分析"音響学会春季研究発表会講演論文集. 355-356 (2003)
-
[Publications] 松坂要佐, 小林哲則: "対面対話の収録と解析のための信号処理とパターン認識"人工知能学会研究会資料. SIG-SLUD-A20 1. 27-32 (2002)
-
[Publications] 江尻康, 松坂要佐, 小林哲則: "対話中における頭部ジェスチャの認識"電子情報通信学会技術研究報告(PRMU). Vol.102, No.218. 31-36 (2002)
-
[Publications] 於久健太郎, 清水健二, 松坂要佐, 小林哲則: "マルチモーダルロボット用マルチプロセッサアーキテクチャ"情報処理学会 計算機アーキテクチャ研究会資料. 47-52 (2002)
-
[Publications] 菊池英明, 白井克彦: "音声対話における心的状態変化の予測をともなうメタ発話生成機構"情報処理学会論文誌. Vol.43, No.7. 2130-2137 (2002)
-
[Publications] 菊池英明, 前川喜久雄: "自発音声韻律ラベリングスキームX-JToBIによるラベリング精度の検証"日本音響学会2002年春季研究発表会講演論文集. 259-260 (2002)
-
[Publications] 菊池英明, 前川喜久雄: "日本語自発音声韻律ラベリングスキームX-JToBIの能力検証"人工知能学会言語・音声理解と対話処理研究会. 33-37 (2002)
-
[Publications] 伊藤敏彦, 甲斐充彦, 他: "目的地設定タスクにおける対話状況の違いによる言語・音響的特徴の比較"情報処理学会論文誌. Vol.43, No.7. 2118-2129 (2002)
-
[Publications] KyeongJu Kim, Yosuke Matsusaka, Tetsunori Kobayashi: "Inter-Module Cooperation Architecture for Interactive Robot"Proc. IR0S2002. Vol.3. 2286-2291 (2002)
-
[Publications] Atsuhiko Kai.Yukari Nonomura, et al.: "Influence of different dialogue situations on user's behavior in spoken corrections"Proc. of International Conference on Spoken Language Processing (ICSLP 2002). 1189-1192 (2002)
-
[Publications] Toshihiko Itoh, Atsuhiko Kai, et al.: "Linguistic and acoustic changes of user's utterances caused by different dialogue situations"Proc. of International Conference on Spoken Language Processing (ICSLP 2002). 545-548 (2002)