自発音声データに対する多元的アノテーション情報のXML化に関する研究

研究課題

研究課題/領域番号	14510638
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	言語学・音声学
研究機関	独立行政法人国立国語研究所
研究代表者	前川喜久雄独立行政法人国立国語研究所, 研究開発部門・第2領域, 領域長 (20173693)
研究分担者	塚原渉電気通信大学, 大学院・情報システム学研究科, 助手菊池英明早稲田大学, 人間科学部, 講師 (70308261) 小磯花絵独立行政法人国立国語研究所, 研究開発部門・第2領域, 研究員 (30312200) 米山聖子大東文化大学, 外国語学部, 講師 (60365856) 籠宮隆之独立行政法人国立国語研究所, 研究開発部門第2領域, 特別奨励研究員
研究期間 (年度)	2002 – 2003
研究課題ステータス	完了 (2003年度)
配分額 *注記	3,900千円 (直接経費: 3,900千円) 2003年度: 1,200千円 (直接経費: 1,200千円) 2002年度: 2,700千円 (直接経費: 2,700千円)
キーワード	XML / 日本語話し言葉コーパス / 自発音声 / コーパス / 話し言葉 / 『日本語話し言葉コーパス』
研究概要	自然言語は「談話>文句>語>音節>モーラ>音素」の様な階層構造をなしているというのが現代言語学の基本的な仮定である。この仮定は書き言葉にはよくあてはまる。しかし、自発音声(自然な話し言葉)においては、様々な理由によって、明瞭な階層構造を認定しがたいケースが頻出する。本研究の目的は、この破綻にどのような類型が存在するかを『日本語話し言葉コーパス』に記録された膨大なデータを用いて検討し、そのような破綻を含む言語データをXML文書化する方法を考案することである。初年度には『日本語話し言葉コーパス』の転記テキストにおいて階層構造の破綻がどのように生じているかの類型化作業をおこない、一部試験的にXML文書化を実施した。本最終年度は、昨年度の成果を継承して、XML文書の仕様を確定し、『日本語話し言葉コーパス』に含まれる752万語分の転記テキスト(音声データ661時間分に該当)と形態素解析結果をXML文書化した。そのうち約50万語(44時間相当)に関しては、上記に加えて分節音とイントネーションの両面にわたる音声ラベルもXML文書中にとりこんだ。このようにして作成されたXML文書は、複雑な構造(最大で10階層、17要素、208属性)を有しているので、その検索は容易でない。そこで『日本語話し言葉コーパス』用のXML文書検索ツールを開発した。このツールは、GUIを介して検索式(XPathないしX-Query)を生成する機能とともに、検索結果をXSLでフォーマットしてユーザーが望む形式で出力する機能を有している。本ツールはJAVAで開発されているので、主要なOS上で利用できる。本研究の成果である『日本語話し言葉コーパス』のXML文書と検索ツールは『日本語話し言葉コーパス』公開版の一部として2004年6月上旬に一般公開する予定である。

報告書

(3件)

2003 実績報告書研究成果報告書概要
2002 実績報告書

研究成果
(24件)

すべてその他

すべて文献書誌 (24件)

[文献書誌] 菊池英明, 前川喜久雄, 五十嵐陽介, 米山聖子, 藤本雅子: "『日本語話し言葉コーパス』の音声ラベリング"音声研究. 7(3). 16-26 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] 菊池英明: "XMLを利用した『日本語話し言葉コーパス』の検証と検索"平成15年度国立国語研究所公開研究発表会予稿集. 15-20 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] H.Kikuchi, K.Maekawa: "Evaluation of the effectiveness of "X-JToBI" : A new prosodic labeling scheme for spontaneous Japanese speech."Proceedings of the 15^<th> International Congress of Phonetic Sciences. 1. 579-582 (2003)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] 菊池英明, 塚原渉, 前川喜久雄: "XMLを利用した『日本語話し言葉コーパス』(CSJ)の整合性検証"第3回話し言葉の科学と工学ワークショップ講演予稿集. 27-32 (2004)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] 塚原渉, 菊池英明, 前川喜久雄: "『日本語話し言葉コーパス』のXML検索環境"第3回話し言葉の科学と工学ワークショップ講演予稿集. 33-38 (2004)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] K.Maekawa, H.Kikuchi, W.Tsukahara: "Corpus of Spontaneous Japanese : Design, Annotation and XML Representation"Proceedings of the International Symposium on Large-scale Knowledge Resources (LKR2004). 19-24 (2004)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] K.Maekawa, H.Kikuchi: "Corpus-based analysis of vowel devoicing in spontaneous Japanese -An interim report-"J.van de Weijer, K.Nanjo and T.Nishihara (eds.) Voicing in Japanese. The Hague: Mouton. (in press). (2004)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] H.Kikuchi, K.Maekawa, Y.Igarashi, K.Yoneyama, M.Fujimoto: "Phonetic labeling of the 'Corpus of Spontaneous Japanese'."Journal of the Phonetic Society of Japan. 7(3). 15-26 (2003)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] H.Kikuchi, K.Maekawa: "Evaluation of the effectiveness of "X-JToBI": A new prosodic labeling scheme for spontaneous Japanese speech"Proceedings of the 15th International Congress of Phonetic Sciences, 1,Barcelona. 579-582 (2003)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] K.Maekawa, H.Kikuchi, W.Tsukahara: "Corpus of Spontaneous Japanese : Design, Annotation and XML Representation"Proceedings of the International Symposium on Large-scale Knowledge Resources (LKR2004) (Tokyo Inst. Technology) (INVITED TALK). 19-24 (2003)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] K.Maekawa, H.Kikuchi: "Corpus-based analysis of vowel devoicing in spontaneous Japanese -An interim report-(J. van de Weijer, K.Nanjo and T.Nishihara (eds.)) (Voicing in Japanese.)"The Hague : Mouton (in press).
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2003 研究成果報告書概要
[文献書誌] 菊池英明, 前川喜久雄, 五十嵐陽介, 米山聖子, 藤本雅子: "『日本語話し言葉コーパス』の音声ラベリング"音声研究. 7(3). 16-26 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 菊池英明: "XMLを利用した『日本語話し言葉コーパス』の検証と検索"平成15年度国立国語研究所公開研究発表会予稿集. 15-20 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] H.Kikuch, K.Maekawa: "Evaluation of the effectiveness of "X-JToBI" : A new prosodic labeling scheme for spontaneous Japanese speech."Proceedings of the 15^<th> International Congress of Phonetic Sciences. 1. 579-582 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 菊池英明, 塚原渉, 前川喜久雄: "XMLを利用した『日本語話し言葉コーパス』(CSJ)の整合性検証"第3回話し言葉の科学と工学ワークショップ講演予稿集. 27-32 (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] 塚原渉, 菊池英明, 前川喜久雄: "『日本語話し言葉コーパス』のXML検索環境"第3回話し言葉の科学と工学ワークショップ講演予稿集. 33-38 (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] K.Maekawa, H.Kikuchi, W.Tsukahara: "Corpus of Spontaneous Japanese : Design, Annotation and XML Representation"Proceedings of the International Symposium on Large-scale Knowledge Resources(LKR2004). 19-24 (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] K.Maekawa, H.Kikuchi: "Corpus-based analysis of vowel devoicing in spontaneous Japanese -An interim report-"J.van de Weijer, K.Nanjo, and T.Nishihara(eds.) Voicing in Japanese. The Hague : Mouton. (in press). (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] K.Maekawa: "Design, compilation, and preliminary analyses of the Corpus of Spontaneous Japanese"Proceedings of the NTT-Stanford workshop on concept and language processing. 1. 13-14 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] K.Maekawa, H.Kikuchi, Y.Igarashi,, J.Venditti: "X-JToBI: An extended J ToBI for spontaneous speech"Proceedings of the 7th International Conference on Spoken Language Processing (ICSLP2002), Denver, Colorado USA. 3. 1545-1548 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 前川喜久雄: "話し言葉コーパスの利用可能性"日本研究的深化与拓展. 1. 46-47 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 菊池英明, 前川喜久雄: "自発音声韻律ラベリングスキームX-JToBIによるラベリング精度の検証"日本音響学会2002年秋季研究発表会講演論文集. 1. 259-260 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 菊池英明, 前川喜久雄: "自発音声韻律ラベリングスキームX-JTbBIの能力検証"人口知能学会研究会SIG-SLUD. A-202-06. 33-36 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 前川喜久雄: "『日本語話し言葉コーパス』を用いた言語変異研究"音声研究. 6・3. 48-59 (2002)
- 関連する報告書
  2002 実績報告書

自発音声データに対する多元的アノテーション情報のXML化に関する研究

研究代表者

前川 喜久雄 独立行政法人国立国語研究所, 研究開発部門・第2領域, 領域長 (20173693)

3,900千円 (直接経費: 3,900千円)

報告書

研究成果

[文献書誌] 菊池英明, 前川喜久雄, 五十嵐陽介, 米山聖子, 藤本雅子: "『日本語話し言葉コーパス』の音声ラベリング"音声研究. 7(3). 16-26 (2003)

説明

関連する報告書

[文献書誌] 菊池英明: "XMLを利用した『日本語話し言葉コーパス』の検証と検索"平成15年度国立国語研究所公開研究発表会予稿集. 15-20 (2003)

説明

関連する報告書

[文献書誌] H.Kikuchi, K.Maekawa: "Evaluation of the effectiveness of "X-JToBI" : A new prosodic labeling scheme for spontaneous Japanese speech."Proceedings of the 15^<th> International Congress of Phonetic Sciences. 1. 579-582 (2003)

説明

関連する報告書

[文献書誌] 菊池英明, 塚原渉, 前川喜久雄: "XMLを利用した『日本語話し言葉コーパス』(CSJ)の整合性検証"第3回話し言葉の科学と工学ワークショップ講演予稿集. 27-32 (2004)

説明

関連する報告書

[文献書誌] 塚原渉, 菊池英明, 前川喜久雄: "『日本語話し言葉コーパス』のXML検索環境"第3回話し言葉の科学と工学ワークショップ講演予稿集. 33-38 (2004)

説明

関連する報告書

[文献書誌] K.Maekawa, H.Kikuchi, W.Tsukahara: "Corpus of Spontaneous Japanese : Design, Annotation and XML Representation"Proceedings of the International Symposium on Large-scale Knowledge Resources (LKR2004). 19-24 (2004)

説明

関連する報告書

[文献書誌] K.Maekawa, H.Kikuchi: "Corpus-based analysis of vowel devoicing in spontaneous Japanese -An interim report-"J.van de Weijer, K.Nanjo and T.Nishihara (eds.) Voicing in Japanese. The Hague: Mouton. (in press). (2004)

説明

関連する報告書

[文献書誌] H.Kikuchi, K.Maekawa, Y.Igarashi, K.Yoneyama, M.Fujimoto: "Phonetic labeling of the 'Corpus of Spontaneous Japanese'."Journal of the Phonetic Society of Japan. 7(3). 15-26 (2003)

説明

関連する報告書

[文献書誌] H.Kikuchi, K.Maekawa: "Evaluation of the effectiveness of "X-JToBI": A new prosodic labeling scheme for spontaneous Japanese speech"Proceedings of the 15th International Congress of Phonetic Sciences, 1,Barcelona. 579-582 (2003)

説明

関連する報告書

[文献書誌] K.Maekawa, H.Kikuchi, W.Tsukahara: "Corpus of Spontaneous Japanese : Design, Annotation and XML Representation"Proceedings of the International Symposium on Large-scale Knowledge Resources (LKR2004) (Tokyo Inst. Technology) (INVITED TALK). 19-24 (2003)

説明

関連する報告書

[文献書誌] K.Maekawa, H.Kikuchi: "Corpus-based analysis of vowel devoicing in spontaneous Japanese -An interim report-(J. van de Weijer, K.Nanjo and T.Nishihara (eds.)) (Voicing in Japanese.)"The Hague : Mouton (in press).

説明

関連する報告書

[文献書誌] 菊池英明, 前川喜久雄, 五十嵐陽介, 米山聖子, 藤本雅子: "『日本語話し言葉コーパス』の音声ラベリング"音声研究. 7(3). 16-26 (2003)

関連する報告書

[文献書誌] 菊池英明: "XMLを利用した『日本語話し言葉コーパス』の検証と検索"平成15年度国立国語研究所公開研究発表会予稿集. 15-20 (2003)

関連する報告書

[文献書誌] H.Kikuch, K.Maekawa: "Evaluation of the effectiveness of "X-JToBI" : A new prosodic labeling scheme for spontaneous Japanese speech."Proceedings of the 15^<th> International Congress of Phonetic Sciences. 1. 579-582 (2003)

関連する報告書

[文献書誌] 菊池英明, 塚原渉, 前川喜久雄: "XMLを利用した『日本語話し言葉コーパス』(CSJ)の整合性検証"第3回話し言葉の科学と工学ワークショップ講演予稿集. 27-32 (2004)

関連する報告書

[文献書誌] 塚原渉, 菊池英明, 前川喜久雄: "『日本語話し言葉コーパス』のXML検索環境"第3回話し言葉の科学と工学ワークショップ講演予稿集. 33-38 (2004)

関連する報告書

[文献書誌] K.Maekawa, H.Kikuchi, W.Tsukahara: "Corpus of Spontaneous Japanese : Design, Annotation and XML Representation"Proceedings of the International Symposium on Large-scale Knowledge Resources(LKR2004). 19-24 (2004)

関連する報告書

[文献書誌] K.Maekawa, H.Kikuchi: "Corpus-based analysis of vowel devoicing in spontaneous Japanese -An interim report-"J.van de Weijer, K.Nanjo, and T.Nishihara(eds.) Voicing in Japanese. The Hague : Mouton. (in press). (2004)

関連する報告書

[文献書誌] K.Maekawa: "Design, compilation, and preliminary analyses of the Corpus of Spontaneous Japanese"Proceedings of the NTT-Stanford workshop on concept and language processing. 1. 13-14 (2002)

関連する報告書

[文献書誌] K.Maekawa, H.Kikuchi, Y.Igarashi,, J.Venditti: "X-JToBI: An extended J ToBI for spontaneous speech"Proceedings of the 7th International Conference on Spoken Language Processing (ICSLP2002), Denver, Colorado USA. 3. 1545-1548 (2002)

関連する報告書

[文献書誌] 前川喜久雄: "話し言葉コーパスの利用可能性"日本研究的深化与拓展. 1. 46-47 (2002)

関連する報告書

[文献書誌] 菊池英明, 前川喜久雄: "自発音声韻律ラベリングスキームX-JToBIによるラベリング精度の検証"日本音響学会2002年秋季研究発表会講演論文集. 1. 259-260 (2002)

関連する報告書

[文献書誌] 菊池英明, 前川喜久雄: "自発音声韻律ラベリングスキームX-JTbBIの能力検証"人口知能学会研究会SIG-SLUD. A-202-06. 33-36 (2002)

関連する報告書

[文献書誌] 前川喜久雄: "『日本語話し言葉コーパス』を用いた言語変異研究"音声研究. 6・3. 48-59 (2002)

関連する報告書

前川喜久雄独立行政法人国立国語研究所, 研究開発部門・第2領域, 領域長 (20173693)