研究課題/領域番号 |
26350466
|
研究機関 | 科学警察研究所 |
研究代表者 |
鎌田 敏明 科学警察研究所, 法科学第四部, 室長 (10356173)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 音声情報処理 / 話者分類 / 法科学 |
研究実績の概要 |
音声による話者認識では、声道の共鳴特性に由来するスペクトル包絡から得られるケプストラムに基づく工学的手法の研究が多く行われてきた。一方、日本語の方言や地域性による話者の地域分類は音声学、言語学の分野で扱われ、工学的手法に基づく研究分野ではほとんど行われていなかった。そこで本研究では、発話者の地域分類において信号処理技術による工学的手法に基づき、話者の特徴を表現するケプストラムを利用した統計的地域分類を確立する。話者の地域属性を、確率モデルを用いて客観的手法による地域分類のシステム構築を行うことにより、法科学分野の側面からの安全な社会基盤の構築を目的とする。 電話を通して収録された音声コーパスから話者モデルを構築するために、音韻の定常部、過渡部に対する特徴量抽出を行い、話者照合による性能評価実験を行った。その結果、ケプストラムを用いた過渡部の性能は定常部とほぼ同等であることが分かった。またフォルマントを特徴量とした過渡部のモデル化を行い、ケプストラムの結果と比較した結果、フォルマントの性能は低いが、照合能力を有することが確認され、実環境の雑音環境下などでは有効であることが分かった。 フォルマントの照合能力については、従来行われてきた研究成果と同様のものであったが、発話区間による差異などの実験を行い、比較検討することによって、実務への応用が期待される。またこの結果については、ケプストラムの変化量の性能に近いことも確認できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
これまでは限定された小規模地域及び特定の特徴量を用いた検証実験及びモデルの構築を行ってきたが、しかし全国規模のデータを用いた話者分類とモデル構築、及びそれらに有効な特徴量の構築には、想定以上の時間が必要であったため、当初の予定より進捗が遅れている。
|
今後の研究の推進方策 |
話者分類のクラスタ数を増やして、3クラスタ以上の地域分類手法に関する実験、検討を行う。また全国規模の音声コーパスを用いた実験を行う。
|
次年度使用額が生じた理由 |
平成28年度は音響分析システムの購入を予定していた。音響分析システムはパソコンと周辺機器及びいくつかのソフトウェアで構成されるものである。現在使用中のパソコンは本研究以外の業務において音響分析や計算処理、文書作成を行っており、また購入後5年程度経過しており、新たなパソコンが必要となるため、予算計上を行っていた。しかし実験計画が特徴量に着目した話者モデルの改善であり、使用中のパソコンによる分析が可能となったため、平成28年度の音響分析システムの購入を見送った。
|
次年度使用額の使用計画 |
大規模話者データ量の分析、実験に対応できる音響分析システムを平成29年度に購入する計画である。
|