• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

韻律コーパスとその作成自動化

研究課題

研究課題/領域番号 12132204
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関静岡大学

研究代表者

北澤 茂良  静岡大学, 情報学部, 教授 (00109018)

研究分担者 板橋 秀一  筑波大学, 電子・情報工学系, 教授 (70151454)
伊藤 敏彦  静岡大学, 情報学部, 助手 (20313926)
桐山 伸也  静岡大学, 情報学部, 助手 (20345804)
NICK Campbell  (株)国際電気通信基礎技術研究所人間情報科学研究所, 主幹研究員
市川 熹  千葉大学, 自然科学研究科, 教授 (80241933)
北村 達也  静岡大学, 情報学部, 助手 (60293594)
CAMPBELL Nick  (株)国際電気通信基礎技術研究所, 人間情報科学研究所, 主幹研究員
研究期間 (年度) 2000 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
64,600千円 (直接経費: 64,600千円)
2003年度: 21,400千円 (直接経費: 21,400千円)
2002年度: 21,200千円 (直接経費: 21,200千円)
2001年度: 22,000千円 (直接経費: 22,000千円)
キーワード韻律コーパス / 基本周波数 / MULTEXT / ECG / FOモデルパラメータ / 音声コーパス / 顔表情 / 対話音声 / EGG / ジェスチャー / MOMEL / 文献検索 / 自動ラベリング / 音素セグメンテーション
研究概要

1.新規の韻律コーパスの作成(静岡大学)
韻律コーパスとして日本語のMULTEXT韻律データベースの40パッセジにJ-ToBI韻律タグ付けを完了し、同様の手法で、筑波大学と千葉大学と東京大孝と東工大グループの既存音声コーパスの各種案内読上げと模擬対話と対話音声、マルチモーダル対話音声、天気予報、模擬感情音声へのJ-ToBIタグ付けを行った。これらのラベリング作業について研究支援者を雇用して行った。言語情報を利用した韻律ラベリング手法の開発と、音素ラベリング支援のための音素自動セグメンテーションと、連接境界における音響的特徴の詳細について研究成果を発表した。
2.既存の音声コーパスの韻律分析と韻律コーパスの作成(筑波大学)
既存の音声コーパスとして、日本音響学会「研究用連続音声データベース」の各種案内読上げ文と模擬対話、重点領域研究「音声対話」の対話音声コーパス、の3種のコーパスに基本周波数分析と発話ラベルと付与した。200ms以上の無音区間で区切られた音声区間を発話単位として、発話単位長を読上げ音声と模擬対話音声で比較した。模擬対話では間投詞や割込みによって発話単位が短くなる。音声パワーと基本周波数の標準偏差は対話に比べて読上げは狭い範囲に集中していることが分かった。
3.ジェスチャー・顔表情付の対話音声収録(千葉大学)
音声対話における視線や頷きなどジェスチャーを記録・分析するため、二台のプロンプター(映像提示装置)を介したマルチモーダルな自然対話の収録を行い、音声・ジェスチャーの収録とタグ付け作業を行った。話し手と聞き手のジェスチャーの相互作用に関して、話者継続時における発話単位終了時での話し手の頷きによって聞き手が相槌や頷きを9割近く返していること、話し手が頷かない場合でも言語情報や音声の韻律情報によって聞き手は反応を3割程度返していることを明らかにした。

報告書

(4件)
  • 2003 実績報告書
  • 2002 実績報告書
  • 2001 実績報告書
  • 2000 実績報告書
  • 研究成果

    (46件)

すべて その他

すべて 文献書誌 (46件)

  • [文献書誌] Kitazawa Shigeyoshi: "Japanese MULTEXT : a Prosodic Corpus"LREC 2004. 発表予定. (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Kitazawa Shigeyoshi: "Perceptual Inspection of V-V Juncture in Japanese"Speech Prosody 2004. 349-352 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Shigeyoshi Kitazawa: "An evaluation of J-ToBI on the Japanese MULTEXT prosodic corpus"Proceedings of Oriental COCOSDA 2003. 201-208 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Shinya Kiriyama: "Japanese Prosodic Labeling Support System Utilizing Linguistic Information"Proceedings of the 8th European Conference on Speech Communication and Technology. 181-184 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 細川雄太: "音素ラベリング支援のための音素自動セグメンテーション性能の分析"日本音響学会2003年秋季研究発表会講演論文集. 315-316 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 外山幸徳: "junctureにおける知覚境界に関する調査"日本音響学会2003年秋季研究発表会講演論文集. 325-326 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 三ッ田佳史: "日本語MULTEXTコーパスにおける言語情報を用いたBIラベリング自動化"日本音響学会2003年秋季研究発表会講演論文集. 363-364 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 桐山伸也: "言語情報を利用した韻律ラベリング手法の開発"電子情報通信学会技術研究報告(音声研究会). SP2003-100. 35-40 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Shehui Bu: "A Method of Automatic Extraction of Fo Model Parameters"Proc.SSPR 2003(Spontaneous Speech Processing and Recognition). 227-230 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] S.Itahashi: "Speech Corpus for Speech Science and Technology"Proc.WESPAC8 (8th Western Pacific Acoustics Conference). 1-10 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 板橋秀一: "音声研究と音声コーパス"電子情報通信学会技術研究報告. SP2003-32. 37-41 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 小張敬之: "日本人の英語発音と英語母音話者音声の韻律特徴の比較"日本音響学会秋季研究発表会講演論文集. 255-256 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] S.Itahashi: "Overview of the East-Asian Activities on Speech Corpora and Assessment"Proc.Oriental COCOSDA Workshop. 1-8 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 板橋秀一: "音声情報処理研究と音声データベース"日本音声言語医学会総会・学術講演会予稿集. 26 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 布社輝: "Foモデルパラメータ自動決定方法についての考察"Preprints SIG-SLP. 211-216 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] S-H Bu: "Evaluation of a Method for Automatic Determination of Fo Model Parameters"Proc.International Conference : Speech Prosody 2004. 431-434 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 冨山良介: "Fo軌跡の折れ線近似による日本人および英語母語話者の英語発話の比較"日本音響学会春季研究発表会講演論文集. 313-314 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 山本佑: "読み上げ音声と対話音声の韻律分析と比較"日本音響学会春季研究発表会講演論文集. 233-234 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 畑野智栄: "東京方言におけるテクセントフレーズ境界の認知について"日本認知科学会第20会大会. 214-215 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 畑野智栄: "日本語音声言語における自然なまとまり感の認知について"日本心理学会第67回大会. 647 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 大須賀智子: "韻律の局所的特徴による文の構造の推定"情報処理学会研究報告. 2003-SLP-46. 1-6 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 大須賀智子: "韻律からの文構造推定における局所的特徴の分析"人工知能学会研究会資料. SIG-SLUD-A3 01-04. 1-6 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Toshie Hatano: "Human Segmentation of Speech by Prosody?"Proceedings of Joint International Conference on Cognitive Science(ICCS/ASCS-2003). 157-162 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Toshie Hatano: "How does Human segment the Speech by Prosody"Proceedings of 8th European Conference on Speech Communication and Technology. 400-403 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 大須賀智子: "韻律のみによる文構造推定手法の検討"日本音響学会 2003年秋季研究発表会全国大会音響学会講演論文集. 1-8-24. 229-230 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 畑野智栄: "アクセントフレーズを用いた音声セグメント境界の認知に関する予備的検討"日本音響学会秋期研究発表会. 1-7-12. 358-386 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 前田真季子: "自然対話における発話者のうなずきに対する聞き手の反応"人工知能学会研究会資料. SIG-SLUD-A3 02-07. 35-42 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Toshie Hatano: "The Cognitive Unit of Segmentation for Speech in Japanese"Proceedings of the 18th International Congress on Acoustics. (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Shigeyoshi Kitazawa: "Juncture Segmentation of Japanese Prosodic Unit Based on the Spectrographic Features"Proceedings of 7^<th> International Conference on Spoken Language Processing, Denver, USA. 1201-1204 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Tatusya Kitamura: "Influence of Prosody, Context, and Word Order in the Identification of Focus in Japanese Dialogue"Proceedings of 7^<th> International Conference on Spoken Language Processing, Denver, USA. 1185-1188 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Tomoko Osuga: "Estimating Syntactic Structure from Prosody in Japanese Speech"IEICE Transaction D. Vol.8, No.3. 558-564 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Yasuo Horiuchi: "Estimating Syntactic Structure from F0 Contour and Pause Duration in Japanese Speech"Proceedings of 7^<th> International Conference on Spoken Language Processing, Denver, USA. 1177-1180 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Shuichi Itahashi: "Design and Creation of Multilingual Speech Corpus"Proc.SNLP-Oriental COCOSDA 2002, Hua Hin, Thailand. 49-53 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Hisao Kuwabara: "The Present Status of Speech Databases in Japan : Development, Management and Application to Speech Research"Proc. LREC 2002 (International Conference on Language Resources and Evaluation ) Las Palmas de Gran Canaria, Spain. 10-15 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Kitazawa, S., Kitamura, T., Mochizuki, K., Itoh, T.: "Periodicity of Japanese Accent in Continuous Speech"Proceedings of the Speech Prosody 2002. (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Kitazawa Shigeyoshi, Kitamura T., Mochiduki K., Itoh T.: "Preliminary Study of Japanese MULTEXT : a Prosodic Corpus"International Conference on Speech Processing, Taejon, Korea. 825-828 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 北村達也, 伊藤敏彦, 望月和也, 北澤茂良: "韻律データベース構築のための韻律に基づく韻律句ラベリング"日本音響学会2002年春季研究発表会講演論文集. 369-370 (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 前田真季子, 堀内靖雄, 市川熹: "対話音声コーパスにおける画像情報のアノテーション手法の検討"情報処理学会研究報告. SLP-38・4. (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 大須賀智子, 堀内靖雄, 市川熹: "音素セグメンテーションの自動化に関する検討"『話し言葉』の科学と工学ワークショップ講演予稿集. 143-148 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Itahashi S., Shimizu N., Yamamoto M.: "Recording and Analysis of Spoken Dialogues on Document Retri eval"Proc. Oriental COCOSDA Workshop 2001, Daejon, Korea. 18-21 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 鈴木則夫,堀内靖雄,市川熹: "抑揚情報による木構造の準実時間推定"日本音響学会春季研究発表会講演論文集. 3-3-7. 107-108 (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 清水久志,堀内靖雄,市川熹: "自然対話における発話の時間構造の分析"人工知能学会 言語・音声理解と対話処理研究会. SLUD-A. 31-36 (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 大須賀智子,堀内靖雄,市川熹: "音素セグメンテーションの自動化に関る検討"「話し言葉の科学と工学」ワークショップ、科学技術庁「話し言葉の言語的・パラ言語的構造の解明に基づく『話し言葉工学』の構築」. 143-148 (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Shuichi Itahashi,Nobuaki Shimizc Mikio Yamamoto: "Recording and Analysis of Simulated Spoken Dialogues on Document Retrieral"Proc.ISSD 2000. 3-1-3-4 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 川俣眞人,小野祐介,山本幹雄,板橋秀一: "多言語音声コーパスの構築と分析"日本音響学会2001年春季発表会講演論文集. 2-6-1. 283-284 (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 清水信昭,照沼篤,山本幹雄,板橋秀一: "日本語方言音声コーパスの構築と分析"日本音響学会2001年春季発表会講演論文集. 2-6-2. 285-286 (2001)

    • 関連する報告書
      2000 実績報告書

URL: 

公開日: 2001-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi