2002 Fiscal Year Annual Research Report
音声情報処理技術を応用した弁別素性の音響及び聴覚的側面に関する基礎的研究
Project/Area Number |
14651094
|
Research Institution | Kyoto University |
Principal Investigator |
壇辻 正剛 京都大学, 学術情報メディアセンター, 教授 (10188469)
|
Co-Investigator(Kenkyū-buntansha) |
坪田 康 京都大学, 学術情報メディアセンター, 助手
清水 政明 京都大学, 学術情報メディアセンター, 助手 (10314262)
河原 達也 京都大学, 情報学研究科, 助教授 (00234104)
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Keywords | 弁別素性 / 音響的側面 / 聴覚的側面 / 音響音声学 / 調音音声学 / 音声データベース |
Research Abstract |
弁別素性はdistinctive featuresの訳語であり、示差的特徴と訳されることもあるが、本研究では、弁別素性の音響的側面及び聴覚的側面に関して、新たな理論的枠組みを提供することを目的として、研究活動を推進した。理論を実証するために必要な分析対象の音声データの収集・編集を行い、音声データベースの構築を行った。音声だけではなく、発音時の口唇形状や動態変化を観察することが可能になるように、顔面の正面映像と側面映像を備えたマルチメディア音声データベースの開発研究を行った。プライバシー上の問題から鼻から下の映像のみを利用するような工夫も試みた。口唇映像を利用して、開口度、円唇性/非円唇性、突出度などの諸特徴の抽出と測定に関する基礎的な研究を推進した。また、その音声データベースに基づいて、ワークステーション及びパソコンシステムを活用して、音声分析、特徴抽出を行った。音声データの音響分析を利用して、フォルマント構造の分析を行い、第1フォルマント、第2フォルマント、第2フォルマントと第1フォルマントの差、第3フォルマント以上の高次フォルマントの情報等を利用して、舌の最高点の高低位置、前後位置、円辱性等の分析を行い、弁別素性との対応との検討を行った。弁別素性に関する音響実験、知覚実験をコンピュータ上でシミュレートする準備段階の研究として、音声入力と音声出力を制御し、音声認識も統合した音声インターフェースの構築の研究も推進した。
|
Research Products
(4 results)
-
[Publications] Y.Tsubota, T.Kawahara, M.Dantsuji: "Formant structure estimation using vocal tract length normalization for CALL systems"Acoustical letter, the Journal of the Acoustic Society of Japan. 24巻2号. 93-96 (2002)
-
[Publications] 坪田康, Antoine Raux, 壇辻正剛: "発音誤りの優先度付けを行う日本人用英語発音学習システム"日本音響学会講演論文集. 501-502 (2003)
-
[Publications] Masaaki Shimizu, Yoshihiro Tomiyama, Masatake Dantsuji, Katsumasa Shimizu: "Creating an English Speech Database Spoken by Japanese Students for Use with CALL System"Proceedings of SNLP-O-COCOSDA. 307-314 (2002)
-
[Publications] 壇辻 正剛(玉村文郎 編): "大学・大学院総合日本語"凡人社. 130 (2002)