• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

発話状態と音声空間の固有幾何学的関係の研究

研究課題

研究課題/領域番号 18700172
研究種目

若手研究(B)

配分区分補助金
研究分野 知覚情報処理・知能ロボティクス
研究機関北陸先端科学技術大学院大学

研究代表者

LU Xugang  北陸先端科学技術大学院大学, 情報科学研究科, 助教 (20362022)

研究期間 (年度) 2006 – 2007
研究課題ステータス 完了 (2007年度)
配分額 *注記
3,400千円 (直接経費: 3,400千円)
2007年度: 1,200千円 (直接経費: 1,200千円)
2006年度: 2,200千円 (直接経費: 2,200千円)
キーワード幾何学的類似性 / 低次元空間 / 調音空間 / 音響空間 / 音声認識技術
研究概要

本研究では、調音または音響空間に関係なく音声パターンは低次元空間上に分布すると仮定する。この仮定に基づき、音声パターン間の内在的関係は類似性に基づく幾何学空間上で表現される。この2年間のプロジェクトで、我々は調音と音響の双方の空間内で音声パターンの関係を探究し、その二つ空間の関係や両空間のマッピングについて調査する。初めに、日本語5母音、/a/、/i/、/u/、/e/、/o/に焦点を当てる。単音状態と調音結合状態間の変形とみなせる音声の調音結合を考慮して、我々はCV系列パターンに加え、調音結合の関係を調べるために単母音のパターンも音声資料とする。音声コーパスを構築するため、ElectroMagnetic Articulographic (EMA)を用いて発話の調音運動を収録し、同時に音声の音響信号も記録する。この音声コーパスを使って、音声に内在する低次元空間を見つけ出す。また、音声パターン間の変形の探究も行う。調音と音響空間上の音声信号は高次元データ列とみなすことができる。しかし我々の仮定に基づけば、音声信号の内在表現は類似性が十分保たれた低次元空間上に分布している。我々は幾何学学習法を検討し、調音と音響空間の双方で音声パターンの幾何学空間を探究する。我々は、3つの大会で我々の結果を提示しました.

報告書

(2件)
  • 2007 実績報告書
  • 2006 実績報告書
  • 研究成果

    (2件)

すべて 2008

すべて 雑誌論文 (2件)

  • [雑誌論文] An investigation of dependencies between frequency components and speaker characteristics for text-independent speaker identification2008

    • 著者名/発表者名
      Xugang Lu, Jianwu Dang
    • 雑誌名

      Speech communication 50

      ページ: 312-322

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] A comparative evaluation of MTF based blind restoration of the sub-band power envelopes of speechas a front-end processor forASR systems2008

    • 著者名/発表者名
      Xugang Lu, Masashi Unoki, Masato Akagi
    • 雑誌名

      Journal of acoustic science and technology

    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2006-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi