• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

韻律コーパスとその作成自動化

Research Project

Project/Area Number 12132204
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionShizuoka University

Principal Investigator

北澤 茂良  静岡大学, 情報学部, 教授 (00109018)

Co-Investigator(Kenkyū-buntansha) 板橋 秀一  筑波大学, 電子・情報工学系, 教授 (70151454)
伊藤 敏彦  静岡大学, 情報学部, 助手 (20313926)
桐山 伸也  静岡大学, 情報学部, 助手 (20345804)
NICK Campbell  (株)国際電気通信基礎技術研究所人間情報科学研究所, 主幹研究員
市川 熹  千葉大学, 自然科学研究科, 教授 (80241933)
北村 達也  静岡大学, 情報学部, 助手 (60293594)
CAMPBELL Nick  (株)国際電気通信基礎技術研究所, 人間情報科学研究所, 主幹研究員
Project Period (FY) 2000 – 2003
Project Status Completed (Fiscal Year 2003)
Budget Amount *help
¥64,600,000 (Direct Cost: ¥64,600,000)
Fiscal Year 2003: ¥21,400,000 (Direct Cost: ¥21,400,000)
Fiscal Year 2002: ¥21,200,000 (Direct Cost: ¥21,200,000)
Fiscal Year 2001: ¥22,000,000 (Direct Cost: ¥22,000,000)
Keywords韻律コーパス / 基本周波数 / MULTEXT / ECG / FOモデルパラメータ / 音声コーパス / 顔表情 / 対話音声 / EGG / ジェスチャー / MOMEL / 文献検索 / 自動ラベリング / 音素セグメンテーション
Research Abstract

1.新規の韻律コーパスの作成(静岡大学)
韻律コーパスとして日本語のMULTEXT韻律データベースの40パッセジにJ-ToBI韻律タグ付けを完了し、同様の手法で、筑波大学と千葉大学と東京大孝と東工大グループの既存音声コーパスの各種案内読上げと模擬対話と対話音声、マルチモーダル対話音声、天気予報、模擬感情音声へのJ-ToBIタグ付けを行った。これらのラベリング作業について研究支援者を雇用して行った。言語情報を利用した韻律ラベリング手法の開発と、音素ラベリング支援のための音素自動セグメンテーションと、連接境界における音響的特徴の詳細について研究成果を発表した。
2.既存の音声コーパスの韻律分析と韻律コーパスの作成(筑波大学)
既存の音声コーパスとして、日本音響学会「研究用連続音声データベース」の各種案内読上げ文と模擬対話、重点領域研究「音声対話」の対話音声コーパス、の3種のコーパスに基本周波数分析と発話ラベルと付与した。200ms以上の無音区間で区切られた音声区間を発話単位として、発話単位長を読上げ音声と模擬対話音声で比較した。模擬対話では間投詞や割込みによって発話単位が短くなる。音声パワーと基本周波数の標準偏差は対話に比べて読上げは狭い範囲に集中していることが分かった。
3.ジェスチャー・顔表情付の対話音声収録(千葉大学)
音声対話における視線や頷きなどジェスチャーを記録・分析するため、二台のプロンプター(映像提示装置)を介したマルチモーダルな自然対話の収録を行い、音声・ジェスチャーの収録とタグ付け作業を行った。話し手と聞き手のジェスチャーの相互作用に関して、話者継続時における発話単位終了時での話し手の頷きによって聞き手が相槌や頷きを9割近く返していること、話し手が頷かない場合でも言語情報や音声の韻律情報によって聞き手は反応を3割程度返していることを明らかにした。

Report

(4 results)
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • 2001 Annual Research Report
  • 2000 Annual Research Report
  • Research Products

    (46 results)

All Other

All Publications (46 results)

  • [Publications] Kitazawa Shigeyoshi: "Japanese MULTEXT : a Prosodic Corpus"LREC 2004. 発表予定. (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Kitazawa Shigeyoshi: "Perceptual Inspection of V-V Juncture in Japanese"Speech Prosody 2004. 349-352 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Shigeyoshi Kitazawa: "An evaluation of J-ToBI on the Japanese MULTEXT prosodic corpus"Proceedings of Oriental COCOSDA 2003. 201-208 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Shinya Kiriyama: "Japanese Prosodic Labeling Support System Utilizing Linguistic Information"Proceedings of the 8th European Conference on Speech Communication and Technology. 181-184 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 細川雄太: "音素ラベリング支援のための音素自動セグメンテーション性能の分析"日本音響学会2003年秋季研究発表会講演論文集. 315-316 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 外山幸徳: "junctureにおける知覚境界に関する調査"日本音響学会2003年秋季研究発表会講演論文集. 325-326 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 三ッ田佳史: "日本語MULTEXTコーパスにおける言語情報を用いたBIラベリング自動化"日本音響学会2003年秋季研究発表会講演論文集. 363-364 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 桐山伸也: "言語情報を利用した韻律ラベリング手法の開発"電子情報通信学会技術研究報告(音声研究会). SP2003-100. 35-40 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Shehui Bu: "A Method of Automatic Extraction of Fo Model Parameters"Proc.SSPR 2003(Spontaneous Speech Processing and Recognition). 227-230 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] S.Itahashi: "Speech Corpus for Speech Science and Technology"Proc.WESPAC8 (8th Western Pacific Acoustics Conference). 1-10 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 板橋秀一: "音声研究と音声コーパス"電子情報通信学会技術研究報告. SP2003-32. 37-41 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 小張敬之: "日本人の英語発音と英語母音話者音声の韻律特徴の比較"日本音響学会秋季研究発表会講演論文集. 255-256 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] S.Itahashi: "Overview of the East-Asian Activities on Speech Corpora and Assessment"Proc.Oriental COCOSDA Workshop. 1-8 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 板橋秀一: "音声情報処理研究と音声データベース"日本音声言語医学会総会・学術講演会予稿集. 26 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 布社輝: "Foモデルパラメータ自動決定方法についての考察"Preprints SIG-SLP. 211-216 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] S-H Bu: "Evaluation of a Method for Automatic Determination of Fo Model Parameters"Proc.International Conference : Speech Prosody 2004. 431-434 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 冨山良介: "Fo軌跡の折れ線近似による日本人および英語母語話者の英語発話の比較"日本音響学会春季研究発表会講演論文集. 313-314 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 山本佑: "読み上げ音声と対話音声の韻律分析と比較"日本音響学会春季研究発表会講演論文集. 233-234 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 畑野智栄: "東京方言におけるテクセントフレーズ境界の認知について"日本認知科学会第20会大会. 214-215 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 畑野智栄: "日本語音声言語における自然なまとまり感の認知について"日本心理学会第67回大会. 647 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 大須賀智子: "韻律の局所的特徴による文の構造の推定"情報処理学会研究報告. 2003-SLP-46. 1-6 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 大須賀智子: "韻律からの文構造推定における局所的特徴の分析"人工知能学会研究会資料. SIG-SLUD-A3 01-04. 1-6 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Toshie Hatano: "Human Segmentation of Speech by Prosody?"Proceedings of Joint International Conference on Cognitive Science(ICCS/ASCS-2003). 157-162 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Toshie Hatano: "How does Human segment the Speech by Prosody"Proceedings of 8th European Conference on Speech Communication and Technology. 400-403 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 大須賀智子: "韻律のみによる文構造推定手法の検討"日本音響学会 2003年秋季研究発表会全国大会音響学会講演論文集. 1-8-24. 229-230 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 畑野智栄: "アクセントフレーズを用いた音声セグメント境界の認知に関する予備的検討"日本音響学会秋期研究発表会. 1-7-12. 358-386 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 前田真季子: "自然対話における発話者のうなずきに対する聞き手の反応"人工知能学会研究会資料. SIG-SLUD-A3 02-07. 35-42 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Toshie Hatano: "The Cognitive Unit of Segmentation for Speech in Japanese"Proceedings of the 18th International Congress on Acoustics. (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Shigeyoshi Kitazawa: "Juncture Segmentation of Japanese Prosodic Unit Based on the Spectrographic Features"Proceedings of 7^<th> International Conference on Spoken Language Processing, Denver, USA. 1201-1204 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Tatusya Kitamura: "Influence of Prosody, Context, and Word Order in the Identification of Focus in Japanese Dialogue"Proceedings of 7^<th> International Conference on Spoken Language Processing, Denver, USA. 1185-1188 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Tomoko Osuga: "Estimating Syntactic Structure from Prosody in Japanese Speech"IEICE Transaction D. Vol.8, No.3. 558-564 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] Yasuo Horiuchi: "Estimating Syntactic Structure from F0 Contour and Pause Duration in Japanese Speech"Proceedings of 7^<th> International Conference on Spoken Language Processing, Denver, USA. 1177-1180 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Shuichi Itahashi: "Design and Creation of Multilingual Speech Corpus"Proc.SNLP-Oriental COCOSDA 2002, Hua Hin, Thailand. 49-53 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Hisao Kuwabara: "The Present Status of Speech Databases in Japan : Development, Management and Application to Speech Research"Proc. LREC 2002 (International Conference on Language Resources and Evaluation ) Las Palmas de Gran Canaria, Spain. 10-15 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Kitazawa, S., Kitamura, T., Mochizuki, K., Itoh, T.: "Periodicity of Japanese Accent in Continuous Speech"Proceedings of the Speech Prosody 2002. (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] Kitazawa Shigeyoshi, Kitamura T., Mochiduki K., Itoh T.: "Preliminary Study of Japanese MULTEXT : a Prosodic Corpus"International Conference on Speech Processing, Taejon, Korea. 825-828 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 北村達也, 伊藤敏彦, 望月和也, 北澤茂良: "韻律データベース構築のための韻律に基づく韻律句ラベリング"日本音響学会2002年春季研究発表会講演論文集. 369-370 (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] 前田真季子, 堀内靖雄, 市川熹: "対話音声コーパスにおける画像情報のアノテーション手法の検討"情報処理学会研究報告. SLP-38・4. (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 大須賀智子, 堀内靖雄, 市川熹: "音素セグメンテーションの自動化に関する検討"『話し言葉』の科学と工学ワークショップ講演予稿集. 143-148 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] Itahashi S., Shimizu N., Yamamoto M.: "Recording and Analysis of Spoken Dialogues on Document Retri eval"Proc. Oriental COCOSDA Workshop 2001, Daejon, Korea. 18-21 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 鈴木則夫,堀内靖雄,市川熹: "抑揚情報による木構造の準実時間推定"日本音響学会春季研究発表会講演論文集. 3-3-7. 107-108 (2001)

    • Related Report
      2000 Annual Research Report
  • [Publications] 清水久志,堀内靖雄,市川熹: "自然対話における発話の時間構造の分析"人工知能学会 言語・音声理解と対話処理研究会. SLUD-A. 31-36 (2001)

    • Related Report
      2000 Annual Research Report
  • [Publications] 大須賀智子,堀内靖雄,市川熹: "音素セグメンテーションの自動化に関る検討"「話し言葉の科学と工学」ワークショップ、科学技術庁「話し言葉の言語的・パラ言語的構造の解明に基づく『話し言葉工学』の構築」. 143-148 (2001)

    • Related Report
      2000 Annual Research Report
  • [Publications] Shuichi Itahashi,Nobuaki Shimizc Mikio Yamamoto: "Recording and Analysis of Simulated Spoken Dialogues on Document Retrieral"Proc.ISSD 2000. 3-1-3-4 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 川俣眞人,小野祐介,山本幹雄,板橋秀一: "多言語音声コーパスの構築と分析"日本音響学会2001年春季発表会講演論文集. 2-6-1. 283-284 (2001)

    • Related Report
      2000 Annual Research Report
  • [Publications] 清水信昭,照沼篤,山本幹雄,板橋秀一: "日本語方言音声コーパスの構築と分析"日本音響学会2001年春季発表会講演論文集. 2-6-2. 285-286 (2001)

    • Related Report
      2000 Annual Research Report

URL: 

Published: 2001-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi