1998 年度研究成果報告書概要

音声とカラー顔画像の融合処理に基づく対話型人物認識システムに関する研究

研究課題

研究課題/領域番号	08680443
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	情報システム学(含情報図書館学)
研究機関	大阪電気通信大学
研究代表者	松村雅史大阪電気通信大学, 情報工学部, 助教授 (80209618)
研究期間 (年度)	1996 – 1998
キーワード	マイクロホンアレイ / 音声強調 / 話者位置の推定 / 音源定位 / 口唇領域の抽出 / 動画像処理 / 三次元声道 / 肌のカラーモデル
研究概要	音声に含まれる個人的特徴の抽出は,音声認識の話者適応化,個性的な自然音声の合成,人物認識などの研究の中で最も基本的な研究課題である。本研究では,音声の個人的特徴と発話時の顔の特徴を高精度で抽出し,総合的あるいは選択的に活用し,端末を操作する人物を認識するシステムの開発を研究目的とする。具体的には、カラーCCDカメラとマイクロホンアレイを設置した視聴覚融合センシングシステムの開発,音声生成過程の解析に基づく個人性情報の抽出を研究目的とする。本研究の成果は以下の通りである。 (1) マイクロホンアレイ信号とカラー動画像を同期を取って計測するシステムを構築した。 (2) マイクロホンアレイ信号の時間差分を用いた音源定位システムを開発した。実音声を用いた音源定位実験を行い,端末から50cm離れた音源位置を誤差2.3cm以内で推定することに成功した。 (3) 整合フィルタにより特定話者に対して音声を強調させる話者依存型音声強調法を考案した。周囲雑音が存在する環境において特定話者の実音声強調実験を行い,登録した話者の音声に対し,ホルマント周波数が精度よく推定できる事を示した。 (4) 口唇領域の動画像のフレーム間差分演算により動的特徴を抽出し,口唇部の変動パターンより単語を認識する手法を考案した。都道府県名の単語認識を行ない,認識率97%を得た。また,認識率が話者に大きく依存する単語が存在し,個人の特徴が最もよく現れる単語は,話者により異なることが明らかになった。 (5) 磁気共鳴映像法(MRI)を用いて摩擦音生成時の声道形状の計測に成功した。この三次元声道内の呼気流を有限要素法で推定し,摩擦音生成シミュレーションに成功した。以上の研究成果を踏まえ下記の課題も明らかになった。 (1) 音声分析技術の高度化には,音声生成過程の解析が必要であり,磁気共鳴影像法(MRI)により計測した三次元声道内の音圧分布や呼気流の速度分布の解析が必要であること。 (2) 人物認識実験では,音声による認識結果と顔画像の結果が異なる場合も認めらた。このようなメディア間の認識結果の矛盾やインターラクションの解析の必要性も明らかになった。

研究成果
(10件)

すべてその他

すべて文献書誌 (10件)

[文献書誌] 新川拓也: "磁気共鳴映像法を用いた摩擦音発声時の三次元形状の計測" 電気学会論文誌C. Vol.118-C No.718. 1060-1065 (1998)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] 新川拓也: "有限要素法を用いた摩擦音発生時の声道内呼気流の推定" 電気学会論文誌C. 発表予定.
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] T.Niikawa: "Accurate measurement of three-dimensional shapes of vocal tract and dental crown using magnetic resonance imaging" Third Joint meeting of Acoustical society of America and Japan. 2pSC13. 867-872 (1996)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] T.Niikawa: "Acoustic Characteristics of three-dimensional vocal tract shapes measured by MRI during vowel production" Hokkaido Workshop on speech production. 1-2. 8-9 (1998)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] T.Niikawa: "FEM analysis of aspirated air flow in three-dimentional vocal tract during fricative consonant phonation" 5th International Conferene on Spoken Language Processing. Fr1R15. 3127-3130 (1998)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] Takuya Niikawa, Masafumi Matsumura, Koji Shimizu, Yasuji Hashimoto, Takashi Tachimura and Takashi Wada: "Measurement of three-dimensional shapes of vocal tract using magnetic resonance imaging." Trans.IEE of Japan. Vol.118-C,No.7/8. 1060-1065 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Takuya Niikawa, Takashi Tachimura, Takeshi Wada, Masafumi Matsumura Hiroshi Umeo: "FEM analysis aspi-rated air flow in three-dimensional vocal tract dur-ing fricative consonant phonation." Trans.IEE of Japan. (To appear).
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Takuya Niikawa, Masafumi Matsumura, Takashi Tachimura, Takeshi Wada, Koji Shimizu, and Yasuji Hashimoto: "Accurate measurement of three-dimensional shapes of vocal tract and dental crown using mag-netic resonance imaging : Japanese fricative conso-nants." Third Joint meeting of Acoustical society of America and acoustical so-ciety of Japan. 2pSC13. 867-872 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Takuya Niikawa, Eri Kawano, Masafumi Matsumura, Takashi Tachimura, and Takeshi Wada: "Acoustic char-acteristics of three-dimensional vocal tract chapes measured by MRI during vowel production." Hokkaido Workshop on Speech Production. 1-2 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Takuya Niikawa, Masafumi Matsumura, Takashi Tachimura, and Takeshi Wada: "FEM analysis of aspi-rated air flow in three-dimensional vocal tract dur-ing fricative consonant phonation." 5th International Conference on Spoken Language Process-ing, Fr1R15. 3127-3130 (1998)
- 説明
  「研究成果報告書概要(欧文)」より

1998 年度 研究成果報告書概要

音声とカラー顔画像の融合処理に基づく対話型人物認識システムに関する研究

研究代表者

松村 雅史 大阪電気通信大学, 情報工学部, 助教授 (80209618)

研究成果

[文献書誌] 新川 拓也: "磁気共鳴映像法を用いた摩擦音発声時の三次元形状の計測" 電気学会論文誌C. Vol.118-C No.718. 1060-1065 (1998)

説明

[文献書誌] 新川 拓也: "有限要素法を用いた摩擦音発生時の声道内呼気流の推定" 電気学会論文誌C. 発表予定.

説明

[文献書誌] T.Niikawa: "Accurate measurement of three-dimensional shapes of vocal tract and dental crown using magnetic resonance imaging" Third Joint meeting of Acoustical society of America and Japan. 2pSC13. 867-872 (1996)

説明

[文献書誌] T.Niikawa: "Acoustic Characteristics of three-dimensional vocal tract shapes measured by MRI during vowel production" Hokkaido Workshop on speech production. 1-2. 8-9 (1998)

説明

[文献書誌] T.Niikawa: "FEM analysis of aspirated air flow in three-dimentional vocal tract during fricative consonant phonation" 5th International Conferene on Spoken Language Processing. Fr1R15. 3127-3130 (1998)

説明

[文献書誌] Takuya Niikawa, Masafumi Matsumura, Koji Shimizu, Yasuji Hashimoto, Takashi Tachimura and Takashi Wada: "Measurement of three-dimensional shapes of vocal tract using magnetic resonance imaging." Trans.IEE of Japan. Vol.118-C,No.7/8. 1060-1065 (1998)

説明

[文献書誌] Takuya Niikawa, Takashi Tachimura, Takeshi Wada, Masafumi Matsumura Hiroshi Umeo: "FEM analysis aspi-rated air flow in three-dimensional vocal tract dur-ing fricative consonant phonation." Trans.IEE of Japan. (To appear).

説明

説明

[文献書誌] Takuya Niikawa, Eri Kawano, Masafumi Matsumura, Takashi Tachimura, and Takeshi Wada: "Acoustic char-acteristics of three-dimensional vocal tract chapes measured by MRI during vowel production." Hokkaido Workshop on Speech Production. 1-2 (1998)

説明

[文献書誌] Takuya Niikawa, Masafumi Matsumura, Takashi Tachimura, and Takeshi Wada: "FEM analysis of aspi-rated air flow in three-dimensional vocal tract dur-ing fricative consonant phonation." 5th International Conference on Spoken Language Process-ing, Fr1R15. 3127-3130 (1998)

説明

1998 年度研究成果報告書概要

松村雅史大阪電気通信大学, 情報工学部, 助教授 (80209618)

[文献書誌] 新川拓也: "磁気共鳴映像法を用いた摩擦音発声時の三次元形状の計測" 電気学会論文誌C. Vol.118-C No.718. 1060-1065 (1998)

[文献書誌] 新川拓也: "有限要素法を用いた摩擦音発生時の声道内呼気流の推定" 電気学会論文誌C. 発表予定.