2002 Fiscal Year Annual Research Report
Project/Area Number |
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 大学院・新領域創成科学研究科, 教授 (50111472)
Co-Investigator(Kenkyū-buntansha) |
北澤 茂良 静岡大学, 情報学部, 教授 (00109018)
柳田 益造 同志社大学, 工学部, 教授 (00116120)
藤崎 博也 東京大学, 大学院・工学系研究科, 名誉教授 (80010776)
小林 哲則 早稲田大学, 理工学部, 教授 (30162001)
尾関 和彦 電気通信大学, 電気通信学部, 教授 (50214135)
Keywords | 韻律 / 音声言語処理 / 全体会議 / シンポジウム / プロシーディングス / 国際会議 / 韻律コーパス / 総括班 |
Research Abstract |
領域全体の研究の実を挙げることを目的に、研究領域の統括、計画研究班間の調整、民間および他の研究との連携、全体会議・研究成果発表会の開催、シンポジウムの企画・開催、国際会議等での関連研究の調査・成果の公表、研究成果の公開推進等を行った。本年度は各班の成果の公開、班間の協調整備を中心に以下の成果を達成した。 1.2回の全体会議/総括班会議を開催して領域の各計画研究班の研究成果を発表・討議するとともに、本年度の研究の進め方に関する討議と方針の策定、次年度の研究計画の策定を行った。 2.第2回全体会議に引き続き、3名の海外の研究者を招待したシンポジウムを開催し、研究成果発表、研究内容討議を行った。全体会議・シンポジウムは公開とし、プロシーディングスを約200ページの成果報告をかねた冊子として出版して、参加者に配布するとともに、関係研究機関に送付した。 3.音声言語処理国際会議、音声と韻律に関する国際会議等に代表者、分担者が参加し、研究調査と研究発表を行い、海外研究者による領域のサーベイを受けた。特に、音声言語処理国際会議では、代表者が、韻律と音声認識の特別セッションを企画、司会した。また、代表者が韓国音響学会大会で本領域の紹介を行った。 4.本領域に深く関連した国際会議として、第2回の韻律と音声に関する国際会議を代表者が委員長となって2004年3月に開催することになり、その準備を進めた。 5.ホームページを整備し、電子メール等によって各会合を領域全体に周知した。また、代表者、班員が各計画研究班会議に出席して、研究の調整を行った。 6.音声/韻律コーパスを領域内で配布するとともに、基本周波数パターン自動分析、HMM音声合成等のプログラムを共有する準備を進めた。 韻律コーパスが重要であるとの認識のもとに、コーパス班をはじめ、多様性班、合成班、認識班をはじめ領域全体の意見を集約することを行った。
Research Products
(15 results)
[Publications] Shinya Kiriyama: "Development and evaluation of a spoken dialogue system for academic document retrieval with a focus on reply generation"Systems and Computers in Japan. 33・4. 25-39 (2002)
[Publications] 成澤修一: "音声の基本周波数パターン生成過程モデルのパラメータ自動抽出法"情報処理学会論文誌. 43・7. 2155-2168 (2002)
[Publications] Atsuhiro Sakurai: "Data-driven generation of FO contours using a superpositional model"Speech Communication. (発表予定). (2003)
[Publications] Carlos Toshinori Ishi: "Mora FO representation for accent type identification in continuous speech and considerations on its relation with perceived pitch values"Speeh Communication. (発表予定). (2003)
[Publications] Keikichi Hirose: "Data-driven synthesis of fundamental frequency contours for TTS systems based on a generation process model"Proc. Speech Prosody 2002. 391-394 (2002)
[Publications] Keikichi Hirose: "Prosody in speech technology -National project and some of our related works -(invited)"Proc. Acoustical Society of Korea. 15-18 (2002)
[Publications] Keikichi Hirose: "Statistical language modeling with prosodic boundaries and its use for continuous speech recognition"Proc. International Conference on Spoken Language Processing. 2. 937-940 (2002)
[Publications] Keikichi Hirose: "Improved corpus-based synthesis of fundamental frequency contours using generation process model"Proc. International Conference on Spoken Language Processing. 3. 2085-2088 (2002)
[Publications] Keikichi Hirose: "Corpus-based synthesis of FO contours for emotional speech using the generation process model"Proceedings 15th International Congress of Phonetic Sciences. (発表予定). (2003)
[Publications] 柳田益造: "知的・感性情報処理の対象としての音楽"日本音響学会誌. 59・3. 159-164 (2003)
[Publications] Tatsuya Kitamura: "Influence of prosody, context, and word order in the identification of focus in Japanese dialogue"Proc. International Conference on Speech Processing. 2. 1185-1188 (2002)
[Publications] Kazuyuki Takagi: "Combination of pause and FO information in dependency analysis of Japanese sentences"Proc. International Conference on Speech Processing. 2. 1173-1176 (2002)
[Publications] Makiko Muto: "Effects of intra-phrase position on acceptability of changes in segmental duration in sentence speech"Proc. International Conference on Speech Processing. 2. 762-765 (2002)
[Publications] 大塚 貴弘: "音源パルス列を考慮した頑健なARX音声分析法"日本音響学会誌. 58,7. 386-397 (2002)
[Publications] 広瀬啓吉(編): "Proceedings for 2002 2nd Plenary Meeting & Symposium on Prosody and Speech processing"特定領域研究「韻律と音声処理」総括班. 200 (2003)