• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

韻律制御に主体をおいた対話システム

Research Project

Project/Area Number 12132205
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionWaseda University

Principal Investigator

小林 哲則  早稲田大学, 理工学部, 教授 (30162001)

Co-Investigator(Kenkyū-buntansha) 中川 聖一  豊橋技術科学大学, 工学部, 教授 (20115893)
菊池 英明  早稲田大学, 人間科学部, 講師 (70308261)
白井 克彦  早稲田大学, 理工学部, 教授 (10063702)
匂坂 芳典  早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)
甲斐 充彦  静岡大学, 工学部, 助教授 (60283496)
Project Period (FY) 2000 – 2003
Project Status Completed (Fiscal Year 2003)
Budget Amount *help
¥54,600,000 (Direct Cost: ¥54,600,000)
Fiscal Year 2003: ¥14,700,000 (Direct Cost: ¥14,700,000)
Fiscal Year 2002: ¥19,800,000 (Direct Cost: ¥19,800,000)
Fiscal Year 2001: ¥20,100,000 (Direct Cost: ¥20,100,000)
Keywords音声対話システム / 韻律 / ターンテーキング / 音声対話
Research Abstract

今年度の成果は以下の通りである。
a)対話のリズムと韻律制御
前年度までの成果に基づいて、対話における話題境界の判別を題材に、韻律情報におけるアクセント句単位でのパラメータを用いて統計的なモデルを学習し、オープンデータに対しても人間と同程度の判別精度が得られることを確認した。(白井・菊池)
自然な対話システムを構築する上で重要なシステム側の相槌生成と話者交替のタイミングの決定を、韻律情報と表層的言語情報を用いて行う方法を開発した。この決定法を、実際に天気予報を題材にした雑談対話システムに実装し、被験者がシステムと対話することにより主観的な評価を行い、有用性を確認した。(中川)
b)対話音声理解応用
対話音声における繰り返しの訂正発話に関する特徴の統計的な分析結果を踏まえ、フレーズ単位の韻律的特徴の併用と訂正発話検出への適用を評価した。また、これらと併せた頑健な対話音声理解のため、フィラーの韻律的な特徴分析・モデル化の検討を行った。(甲斐)
c)対話音声合成応用
語彙の韻律的有標性について程度の副詞を用い、生成・聴覚の両面から分析を行い、自然な会話音声生成のための韻律的強勢制御を実現した。また、統計的計算モデルによる話速制御モデルを作成し、会話音声にみられる局所話速の分析を進め、自由な話速の制御を可能とした。さらに、韻律制御パラメータが合成音声の自然性品質に及ぼす影響を調べた。(匂坂)
d)対話システム
上記の成果をまとめ,対話システムを実装した。特に,顔表情の認識・生成システム,声表情の認識・生成システムなどを前年度までに開発した対話プラットホーム上に統合し,パラ言語情報の授受を可能とするリズムある対話システムを構築した。(小林)

Report

(4 results)
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • 2001 Annual Research Report
  • 2000 Annual Research Report
  • Research Products

    (52 results)

All Other

All Publications (52 results)

  • [Publications] 大久保雅史, 望月亮, 蓑輪利光, 小林哲則: "波形重畳型音声合成における心的態度の再現性評価"第2回 情報科学技術フォーラム FIT2003 一般講演論文集. vol.2. 265-266 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 望月亮, 小林哲則: "PSOLA法における音質改善のための低域スペクトル包絡の補正方法"日本音響学会秋季研究発表会講演論文集. 319-320 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 藤江真也, 八木大三, 菊池英明, 小林哲則: "パラ言語情報を用いた音声対話システム"日本音響学会秋季研究発表会講演論文集. 39-40 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 藤江真也, 江尻康, 菊池英明, 小林哲則: "パラ言語の理解能力を有する対話ロボット"情報処理学会研究技術報告. SLP-48. 13-20 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 江尻康, 中島慶, 藤江真也, 小林哲則: "対話ロボットの動作中における頭部ジェスチャ認識"電子情報通信学会研究技術報告 PRMU2003-153. Vol.103,No.453. 13-18 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 小林 哲則: "ROBISUKE:新世代の対話ロボット"人工知能学科研究会資料. SIG-Challenge-0318-1. 1-6 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 細川健一郎, 藤江真也, 小林哲則: "検索・提案型対話システムのためのユーザとのインタラクションによる適応的意図理解"人工知能学会研究会資料. SIG-SLUD-A302. 21-28 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] S.Fujie, Y.Ejiri, Y.Matsusaka, H.Kikuchi, T.Kobayashi: "Recognition of Para-Linguistic Information and Its Application to Spoken Dialogue System"IEEE ASRU2003(Automatic Speech Recognition and Understanding Workshop). 231-236 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 竹内真士, 北岡教英, 中川聖一: "韻律・表層的言語情報を発話タイミングに用いた雑談対話システム"情報処理学会研究報告. SLP-50-14. 87-92 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Kikuchi Hideaki, Maekawa Kikuo: "Performance of segmental and prosodic labeling of spontaneous speech"Proceedings of the ISCA & IEEE Workshop on Spontaneous Speech Processing and Recognition (SSPR2003). 191-194 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Kikuchi Hideaki, Maekawa Kikuo: "Evaluation of the effectiveness of X-JToBI : A new prosodic labeling scheme for spontaneous Japanese speech"proc.of 15th Int'l Congress of Phonetic Sciences. 579-582 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Maekawa Kikuo, Koiso Hanae, Kikuchi Hideaki, Yoneyama Kiyoko: "Use of a large-scale spontaneous speech corpus in the study of linguistic variation"proc.of 15th Int'l Congress of Phonetic Sciences. 643-664 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 菊池英明, 前川喜久雄, 五十嵐陽介, 米山聖子, 藤本雅子: "日本語話し言葉コーパスの音声ラベリング"音声研究. Vol.7,No.3. 16-26 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 大久保崇, 菊池英明, 白井克彦: "音声対話における韻律を用いた話題境界検出"信学技報. Vol.103,No.519. 235-240 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 山下琢美, 匂坂芳典: "程度副詞のFOにみられる対話音声の自然性知覚について"日本音響学会秋季研究発表会講演論文集. 219-220 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Takumi Yamashita, Yoshinori Sagisaka: "Generation and perception of FO markedness in conversational speech with adverbs expressing degrees"Eurospeech2003 Proc.. 173-176 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 山下琢美, 匂坂芳典: "発話語彙情報に基づく対話音声韻律制御の試み"日本音響学会春季研究発表会講演論文集. 267-268 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 小川博正, 匂坂芳典: "発話情報を用いたFO制御パラメータの自動抽出"日本音響学会春季研究発表会講演論文集. 265-266 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 武藤牧子, 加藤宏明, 津崎実, 匂坂芳典: "文節内音韻長伸縮の許容度に対する発話速度の効果"日本音響学会春季研究発表会講演論文集. 415-416 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Hiromasa Ogawa, Yoshinori Sagisaka: "Automatic Extraction of FO Control Parameters Using Utterance Information"SPEECH PROSODY2004. 447-456 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Yoshinori Sagisaka, Takumi Yamashita, Yoko Kokenawa: "Speech synthesis with attitude"SPEECH PROSODY2004. 401-404 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 武藤牧子, 加藤宏明, 津崎実, 匂坂芳典: "文中の音韻長伸縮の自然性許容に対する発話速度の効果"電子情報通信学会技術報告. 31-36 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 竹内真士, 北岡教英, 中川聖一: "韻律・言語情報を素性とした決定木による自然な応答生成タイミングの検出"日本音響学会講演論文集. 2-4-9. 75-76 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 籠宮隆之, 五十嵐陽介, 菊池英明, 米山聖子, 前川喜久雄: "自発音声コーパスにおけるFO下降開始点位置の分析"音響学会春季研究発表会講演論文集. 317-318 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 近藤 亜希, 前木 大樹, 内藤 拓郎, 白井 克彦, 匂坂 芳典: "日本人発話英語のリズム客観評価モデル"音響学会春季研究発表会講演論文集. 3-6-13. 353-354 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 前木 大樹, 内藤 拓郎, 近藤 亜希, 白井 克彦, 匂坂 芳典: "英語発話リズム客観評価に向けた音響特徴の分析"音響学会春季研究発表会講演論文集. 355-356 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 松坂要佐, 小林哲則: "対面対話の収録と解析のための信号処理とパターン認識"人工知能学会研究会資料. SIG-SLUD-A20 1. 27-32 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 江尻康, 松坂要佐, 小林哲則: "対話中における頭部ジェスチャの認識"電子情報通信学会技術研究報告(PRMU). Vol.102, No.218. 31-36 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 於久健太郎, 清水健二, 松坂要佐, 小林哲則: "マルチモーダルロボット用マルチプロセッサアーキテクチャ"情報処理学会 計算機アーキテクチャ研究会資料. 47-52 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 菊池英明, 白井克彦: "音声対話における心的状態変化の予測をともなうメタ発話生成機構"情報処理学会論文誌. Vol.43, No.7. 2130-2137 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 菊池英明, 前川喜久雄: "自発音声韻律ラベリングスキームX-JToBIによるラベリング精度の検証"日本音響学会2002年春季研究発表会講演論文集. 259-260 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 菊池英明, 前川喜久雄: "日本語自発音声韻律ラベリングスキームX-JToBIの能力検証"人工知能学会言語・音声理解と対話処理研究会. 33-37 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 伊藤敏彦, 甲斐充彦, 他: "目的地設定タスクにおける対話状況の違いによる言語・音響的特徴の比較"情報処理学会論文誌. Vol.43, No.7. 2118-2129 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] KyeongJu Kim, Yosuke Matsusaka, Tetsunori Kobayashi: "Inter-Module Cooperation Architecture for Interactive Robot"Proc. IR0S2002. Vol.3. 2286-2291 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Atsuhiko Kai.Yukari Nonomura, et al.: "Influence of different dialogue situations on user's behavior in spoken corrections"Proc. of International Conference on Spoken Language Processing (ICSLP 2002). 1189-1192 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Toshihiko Itoh, Atsuhiko Kai, et al.: "Linguistic and acoustic changes of user's utterances caused by different dialogue situations"Proc. of International Conference on Spoken Language Processing (ICSLP 2002). 545-548 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 角谷直子, 北岡教英, 中川聖一: "カーナビの地名入力における誤認識時の訂正発話の分析と検出"情報処理学会 音声言語情報処理. SLP-37-11. 61-66 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 鈴木堅悟, 青山一美, 菊池英明, 白井克彦: "多次元心的状態を扱う音声対話システムの構築"情報処理学会 音声言語情報処理. SLP-37-3. 13-18 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 甲斐充彦, 石丸明子, 伊藤敏彦, 小西達裕, 伊東幸宏: "目的地設計タスクにおける訂正発話の特徴分析と検出への応用"日本音響学会秋季研究発表会講演論文集. 2-1-8. 63-64 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 伊藤敏彦, 岩本善行, 水谷誠, 由浅裕規, 甲斐充彦, 小西達裕, 伊東幸宏: "目的地設定タスクにおける対話状況の違いによる言語的特徴の分析"日本音響学会秋季研究発表会講演論文集. 2-1-9. 65-66 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 松坂要佐, 東條剛史, 小林哲則: "グループ会話に参与する対話ロボットの構築"電子情報通信学会 論文誌. Vol.584-D-11 No.6. 898-908 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] Yosuke Matsusaka, shinya Fujie, Tetsunori Kobayashi: "Modeling of conversational strategy for the robot participating in the group conversation"ISCA Interspeech. vol.3. 2173-2176 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 山田大輔,峯松信明,中川聖一: "STRAIGHT-CepstrumとFFT-Cepstrumの音声認識による比較."電子情報通信学会 音声技報. SP200-61. 39-46 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 佐渡詩郎,山本和英,大竹清敬,中川聖一,増山繁: "ニュース文の音声要約のための韻律情報の利用"情報処理学会 自然言語処理. NL140-4. 23-30 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 山本一公,中川聖一: "発話スタイルによる話速・音韻間距離・ゆう度の違いと音声認識性能の関係"電子情報通信学会論文誌. Vol.83-DII,No.11. 2438-2447 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 菊池英明,白井克彦: "対話効率の向上を目的とした音声対話制御のモデル化"ヒューマンインターフェース学会誌. Vol.2,No.2. 145-152 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] Hideaki Kikuchi,Katsuhiko Shirai: "Modeling of Spoken Dialogue Control for Improvement of Dialogue Efficiency"Proc.of IEEE Int'l.Conference on Systems, Man and Cybernetics. 781-785 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] Hideaki Kikuchi,Katsuhiko Shirai: "Improvement of Dialogue Efficiency by Dialogue Control Model According to Performance of Processes"Proc.of Int'l.Conference on Spoken Language Processing. 711-714 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] K.Aoyama,I.Hirano,H.Kikuchi,K.Shirai: "Designing a Domain Independent Platform of Spoken Dialogue System"Proc.of Int'l.Conference on Spoken Language Processing. 1057-1060 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] K.Aoyama,M.Yokoyama,H.Kikuchi,K.Shirai: "Controlling Non-verbal Information in Speaker-change for Spoken Dialogue"2000 IEEE International Conference on System Man and Cybernetics. 1354-1359 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 青山一美,平野泉,菊池英明,白井克彦: "音声対話システム汎用プラットフォームの検討"情報処理学会研究会資料. SLP-30. 7-12 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 平野泉,青山一美,菊池英明,白井克彦: "音声対話システム汎用プラットフォームにおける行動管理部の構築"人工知能学会全国大会(第14回). 134-137 (2000)

    • Related Report
      2000 Annual Research Report

URL: 

Published: 2001-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi