2007 Fiscal Year Annual Research Report
Project/Area Number |
18700172
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
LU Xugang Japan Advanced Institute of Science and Technology, 情報科学研究科, 助教 (20362022)
|
Keywords | 幾何学的類似性 / 低次元空間 / 調音空間 / 音響空間 / 音声認識技術 |
Research Abstract |
本研究では、調音または音響空間に関係なく音声パターンは低次元空間上に分布すると仮定する。この仮定に基づき、音声パターン間の内在的関係は類似性に基づく幾何学空間上で表現される。この2年間のプロジェクトで、我々は調音と音響の双方の空間内で音声パターンの関係を探究し、その二つ空間の関係や両空間のマッピングについて調査する。初めに、日本語5母音、/a/、/i/、/u/、/e/、/o/に焦点を当てる。単音状態と調音結合状態間の変形とみなせる音声の調音結合を考慮して、我々はCV系列パターンに加え、調音結合の関係を調べるために単母音のパターンも音声資料とする。音声コーパスを構築するため、ElectroMagnetic Articulographic (EMA)を用いて発話の調音運動を収録し、同時に音声の音響信号も記録する。この音声コーパスを使って、音声に内在する低次元空間を見つけ出す。また、音声パターン間の変形の探究も行う。調音と音響空間上の音声信号は高次元データ列とみなすことができる。しかし我々の仮定に基づけば、音声信号の内在表現は類似性が十分保たれた低次元空間上に分布している。我々は幾何学学習法を検討し、調音と音響空間の双方で音声パターンの幾何学空間を探究する。我々は、3つの大会で我々の結果を提示しました.
|