研究課題/領域番号 |
25280066
|
研究機関 | 甲南大学 |
研究代表者 |
北村 達也 甲南大学, 知能情報学部, 教授 (60293594)
|
研究分担者 |
伊藤 仁 東北工業大学, 工学部, 准教授 (00436164)
蒔苗 久則 科学警察研究所, 法科学第四部, 主任研究官 (20415441)
齋藤 毅 金沢大学, 電子情報学系, 助教 (70446962)
網野 加苗 科学警察研究所, 法科学第四部, 研究員 (70630698)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 音声 / 音声生成 / 声道 / 鼻腔 / 音響解析 / MRI / 音声の個人性 |
研究実績の概要 |
(1) 発話器官のモデリング:正中面の発話器官の形状から,その外側の形状を推定する手法を開発した.主成分分析を利用して,発話器官の形状を表すパラメーターの数を削減した上で,線形モデルによって正中面の形状から外側の形状を推定するものである.これにより,2次元のデータを収集するだけで,3次元の発話運動データを構築することができ,大幅な効率化が期待できる. (2) 磁気センサシステムによる発話運動計測:磁気センサシステムにより発話運動の計測を行った.このシステムは,舌,口唇,顎などに小型のセンサを貼り付け,磁気を利用してその運動を計測するものである.昨年度はこのシステムのセンサの改良を行い,センサ装着による発話への影響を軽減させることに成功している.口蓋の3次元形状を計測して発話運動データと統合する手法を開発し,これを用いることによって,口蓋形状と舌運動の関係を示した. (3) 鼻腔音響特性のシミュレーション:コーンビームCTデータから抽出した詳細な3次元鼻腔形状に基づいて鼻腔や副鼻腔の音響特性を計算した.CTデータからの鼻腔形状の抽出にあたっては,機械学習を利用して,再現性を向上させる手法を考案した.シミュレーションは時間領域差分法(FDTD法)により実行した.この研究により,鼻腔や副鼻腔による音声スペクトルへの影響を調べる手法を確立できたので,今後対象者を増やして研究を進める. (4) 音声の個人性の知覚要因:公開されている研究用音声データベース(ATR音声データベース)内の文音声を対象にして,聴取実験により,話者間の知覚的類似度を計測した.関東出身の男女各20名の音声を対象にして,のべ100名を超える被験者がその類似度を評価した.話者間の類似度を行列状に示した結果が得られ,学会誌等で公開した.今後,音声の個人性知覚に関する研究をするにあたっての重要な基礎データになると考えている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初予定していたMRI-音声データベースの構築が遅れている.MRIデータを計測予定の機関に,来年度新たに高性能なMRI装置が導入される予定となったことから,その装置で撮像した方がより高品質なデータが得られると考えられたため,計測を延期しているものである.その他,代表者,分担者の体調不良の問題もあり,やや遅れた状態になっている.
|
今後の研究の推進方策 |
発話器官のモデリング手法に関する目途が立ったので,今後この手法の適用範囲を拡大し,種々の音節の発話動態を表現できるモデルの完成を目指す.また,新型のMRI装置による発話運動計測も実施し,そのデータベース化等の作業を進めていく.
|
次年度使用額が生じた理由 |
当初予定していたMRI-音声データベースの構築が遅れていることに加え,代表者,分担者の体調不良の問題もあったため,次年度使用額が生じている.前者については,次年度に,より高性能なMRI装置にて発話運動観測ができる予定となったため,実施を延期しているものである.
|
次年度使用額の使用計画 |
最新のMRI装置により発話運動観測を行い,MRI-音声データベース構築の作業を進めることによって,使用していく計画である.
|