研究課題/領域番号 |
16K00242
|
研究機関 | 九州大学 |
研究代表者 |
鏑木 時彦 九州大学, 芸術工学研究院, 教授 (30325568)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 磁気センサ / 音声生成 / 調音運動 / 磁場シミュレーション |
研究実績の概要 |
音声発話時の調音器官の運動を高精度に観測するため、3次元磁気センサシステムの開発を行っている。磁気センサは毎秒100~200フレームの測定が可能であり、破裂子音などの高速な発話運動に対しても、十分な時間分解能を有している。また、磁気センサでは、音声はもとより、電気式喉頭計(EGG)による声帯振動の同時測定も可能であり、音声の生成過程を総合的に観測できる。 磁気センサでは、位置マーカーの持つ5自由度のパラメータ(位置3個、傾き2個)を決定するため、磁界を生成する送信コイルを5個以上使用し、それらに対応する複数の磁界方程式を連立させる。受信信号からマーカー位置を求める際には、磁界方程式の非線形性やパラメータの自由度が要因となって、複数の解が同一の受信信号を生成し得る状況が生じて、解を一意に決定できなくなる。他方、磁界から受信コイルに誘導される信号は、コイルの位置と傾きに依存するが、コイルの平行移動よりも、回転の方がはるかに大きく受信信号を変化させる。すると、受信信号に対する位置パラメータの感度が相対的に低下し、位置推定精度の劣化を生じてしまう。 これらの問題に対して、本課題では、受信コイルの角度によらず十分な強度を持った磁界成分を受信できるようにするため、従来よりも送信コイルの個数を増やしてシステムを設計する。ここでは、送信コイルから生成される交流磁界を近接場の磁気双極子を用いてモデル化し、この磁場シミュレーションから予測されるマーカー位置の推定結果を基として、推定誤差が最小となる最適な送信コイルの配置を決定する。今年度は、送信コイルの個数を従来の6個から8個に増やし、磁場シミュレーションに基づいて最適なコイル配置の検討を行い、学会で口頭発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度は、研究計画に沿って、磁気センサシステムの送信コイルの個数を従来の6個から8個に増やしたと仮定した上で、磁場シミュレーションに基づいて最適なコイル配置の検討を検討した。さらに、測定領域内に受信コイルが配置された状況を計算機によりシミュレートし、受信信号からマーカー位置の推定を行うことで、測定精度の検証を行った。その結果、8チャンネルシステムが従来の6チャンネルシステムの性能を大幅に向上できることがわかった。ここまでは、研究計画に沿った内容となっており、当初の目標は十分に達成できていると判断することができる。 次年度以降は、今回の送信コイルの最適設計に基づいて、実際に稼働するハードウェアシステムを構築していく予定である。この点について、平成28年度の期間内に、送信コイルの配置を含むハードウェアシステムの設計を一部開始することができた。すなわち、当初の予定を上回る研究の進捗が得られている。 さらに、本課題では、調音運動と音声信号を同時に収録することで、日本語音声についての調音・音響データベースを作成することが目標となっている。この調音・音響データベース作成に関しても、発話内容の検討や実験環境の整備などを行った。また、現行の6チャンネルシステムで調音運動の測定が可能となったことから、男性被験者1名に対して予備実験を行い、実際のデータベースに相当する分量の調音運動と音声信号を収録した。このように、調音・音響データベース作成に関しても、当初の予定を上回るスピードで検討を進めることができた。
|
今後の研究の推進方策 |
次年度は、まず、今年度に行った送信コイルの最適設計に基づいて、実際に稼働するハードウェアシステムを構築していく予定である。一番の問題となるのは、被験者の頭部の周囲に8個の送信コイルを固定するための筐体を作成することと、設計通りの向きに送信コイルを設置するための治具を製作することである。完成したハードウェアシステムおよび制御用ソフトウェアを用いて、マーカー位置の測定精度を評価し、十分な精度が得られていることを確かめる。 さらに、調音運動と音声信号を同時に収録した、日本語音声についての調音・音響データベースの作成についても、検討を進める。平成28年度に行った予備実験によって、被験者への負担や実験環境の不備などが明らかになった。これらの問題を解決しつつ、複数話者を用いた収録実験を実施する。磁気センサでは、音声のほかに声帯の振動パタンを測定する電気喉頭計(EGG)を使用可能である。EGGデータは発声中の声帯振動の時間パタンを表すものであり、音声ピッチ、有声・無声の判別、声門開放率(OQ)などの音源情報を簡易に得ることができる。これは現存する英語音声のコーパスにもなく、本研究に固有のものである。他の研究機関での使用にも耐え得るように、音素調音時点やラベル付与などの整備も行う予定にしている。
|