• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

音声対話システムによる「ため口」の理解と生成

Research Project

Project/Area Number 13780266
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionUtsunomiya University

Principal Investigator

森 大毅  宇都宮大学, 工学部, 助手 (10302184)

Project Period (FY) 2001 – 2002
Project Status Completed (Fiscal Year 2002)
Budget Amount *help
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2002: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2001: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywords音声合成 / 音声対話システム / 音声対話コーパス / 感情ラベリング / パラ言語情報 / 非言語情報 / 声質 / 美的感受性 / 美術鑑賞 / ソフトウェア
Research Abstract

本研究は、俗に「ため口」と呼ばれる敬意表現を伴わない仲間内での会話に用いられる発話様式に着目し、「ため口」の処理を通してこれまでの音声処理で軽視されがちであったパラ言語情報を利用する技術の開発を目的としている。平成14年度の研究計画は、大略以下の通り。
1 ため口を認識する音声対話システムの作成
2 ため口による音声レスポンスの生成
このうち1については会議室予約をタスクとした音声対話システムの製作を完了し、6名の被験者による印象評価実験を行った。このシステムは頑健な文節スポッティングと意味解析に基づいており、通常のあらたまった口調のほか、ため口による発話も受理できる。エージェントに用いるキャラクターを子供のように見える親しみやすいデザインにしたほか、エージェントの発話をため口にしたことにより、ユーザの発話もほとんどがため口となり、期待した音声データが収集できた。音声認識の性能に問題があり、流暢な会話とまでは行かなかったが、これらのデータを基に今後の音声認識の改良をしていく見通しができた。
また2については、13年度の研究成果である韻律と声質の制御によるパラ言語情報の伝達に加え、話しかけやすいインタフェース実現を狙った子供の声によるレスポンス生成に関して研究を行った。その結果、当初の目標であった規則合成方式によるレスポンス生成の実現を研究期間内に完成させることはできなかったものの、子供の発声スピードに合わせて成人が発話した音声の韻律・声道パラメータ、具体的には基本周波数軌跡およびフォルマント周波数を操作することで高品質な子供の声によるレスポンスを生成することができた。この枠組は、親しみやすいエージェントにはそれにふさわしい声が要求されるという現状の音声対話システムにおける問題に対する重要な成果である。
結果として、本研究の目的の主要部分については達成されたと考えている。

Report

(2 results)
  • 2002 Annual Research Report
  • 2001 Annual Research Report
  • Research Products

    (6 results)

All Other

All Publications (6 results)

  • [Publications] 森 大毅: "コーパスベースのソース・フォルマント型テキスト音声合成システム"日本音響学会2002年春季研究発表会講演論文集. Vol.1. 373-374 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 森 大毅: "パラ言語情報を重視した音声対話データベースの設計"日本音響学会2002年春季研究発表会講演論文集. Vol.1. 51-52 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Hiroki Mori: "A data-driven approach to source-formant type text-to-speech system"Proc. International Conference on Spoken Language Processing. 2365-2368 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 森 大毅: "ソース・フォルマント型音声合成における声質変換"日本音響学会2003年春季研究発表会講演論文集. Vol.1. 237-238 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 森 大毅: "コーパスベースのソース・フォルマント型テキスト音声合成システム"日本音響学会2002年春季研究発表会講演論文集. Vol.1. 373-374 (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] 森 大毅: "パラ言語情報を重視した音声対話データベースの設計"日本音響学会2002年春季研究発表会講演論文集. Vol.1. 51-52 (2002)

    • Related Report
      2001 Annual Research Report

URL: 

Published: 2001-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi