2000 Fiscal Year Annual Research Report
Project/Area Number |
09551013
|
Research Institution | Kyoto University |
Principal Investigator |
壇辻 正剛 京都大学, 総合情報メディアセンター, 教授 (10188469)
|
Co-Investigator(Kenkyū-buntansha) |
堂下 修司 龍谷大学, 理工学部, 教授 (00025925)
河原 達也 京都大学, 大学院・情報学研究科, 助教授 (00234104)
梅崎 太造 中部大学, 工学部, 教授 (40193932)
清水 政明 京都大学, 総合情報メディアセンター, 助手 (10314262)
新保 仁 茨城大学, 工学部, 助手 (90311589)
|
Keywords | 音声分析 / フィールドワーク / 音声認識 / 音声データベース / 正規化 / 開口度 / 円唇度 |
Research Abstract |
インフォーマントが発話した音声を音響分析すると共に、音声認識技術を活用して、音声認識の処理を施し、音声データベース中の標準発音とのずれを提示し、矯正するシステムの開発を行った。フィールドワークでの音声分析に適したソフトウェアの開発に関する検討を進め、研究を推進するために必要な分析対象の諸言語の音声データの収集、編集も継続して行った。発話の個人差の正規化の研究も継続して行った。フォルマントやピッチの絶対値は話者の声道の長さや断面積、声帯の厚みや長さなどの声道特性や音源特性の影響を受けるのでそのままでは比較の対象にならないが、従来は、発話時間だけを調整してそのまま容易に比較する方法が行われてきたが、本研究では、適切な比較のためにフォルマント情報やピッチ情報等の個人差を正規化する方策を検討した。インフォーマントから収録した分析用の音声を利用してその場で音声データベース化の準備ができるように、音声ファイル化、ラベリング等の処理が敏速に行えるような研究も進めた。インフォーマントが発音した音声の音響分析から声道予想図、声道断面図等の調音事象への復元を試みた。入力母音に対する、舌の前後位置や高低位置、口唇の形状などの声道予想図をグラフィック処理して、提示する研究を進めた。ピッチ、基本周波数等の韻律(プロソディー)情報の処理の強化の研究を行った。従来の音響分析機器の様に、単に物理的な基本周波数の値だけを表示するだけではなく、幾つかの離散的な単位として処理する研究を進めた。また、従来のピッチ、基本周波数の分析装置は不安定で倍音を拾ってきたり、ピッチの急激な変動についていけなかったりしたが、改良を加え、安定化を図った。収集した音声データの音声学的な記述に基づき音韻論的な考察を加えて、研究を発展させた。
|
Research Products
(7 results)
-
[Publications] Y.Tsubota.Dantsuji,and T.Kawahara: "Computer Assisted English Vowel Learning System for Japanese Speakers using Cross Language Format Structures"Proceedings of the 6^<th> International Conference on Spoken Language Processing. Vol.3. 566-569 (2000)
-
[Publications] 井本和範,壇辻正剛,河原達也: "CALLシステムのための英語文強勢知覚のモデル化"電子情報通信学会技術研究報告. SP2000-1. 1-8 (2000)
-
[Publications] K.Imoto,M.Dantsuji,and T.Kawahara: "Modelling of the Perception of English Sentence Stress for Computer-Assisted language Learning"Proceedings of the 6^<th> International Conference on Spoken Language Processing. Vol.3. 175-178 (2000)
-
[Publications] 坪田康,壇辻正剛,河原達也: "日本人の誤りパターンの対判別を利用した英語発音教示システム"電子情報通信学会技術研究報告. SP2000-125. 25-32 (2000)
-
[Publications] M.Shimizu,M.Dantsuji: "A New Proposal of Laryngeal Features for the Tonal System of Vietnamese"Proceedings of the 6^<th> International Conference on Spoken Language Processing. Vol.II. 519-522 (2000)
-
[Publications] 田中和世,児島宏明,富山義弘,壇辻正剛: "言語に共通な音声符号系とその音響セグメントモデルの作成"日本音響学会2001年春季研究発表会講演論文集. 191-192 (2000)
-
[Publications] 木村成宏,梅崎太造: "発話時における口形状動画像の自動生成"2000年度電気関係学会東海支部連合大会講演論文集. 351-351 (2000)