音声発話における舌、唇、下顎などの調音器官の運動(調音運動)を高精度に計測するため、3次元磁気センサシステムを開発し、さらに音声と調音運動の同時計測に基づいて、日本語としては最大規模の発話データの取得を行なった。 磁気センサシステムに関しては、従来システムの精度向上を目指して、8個の送信チャネルを有するシステムを新規に構築した。本システムでは、調音器官の表面に固定した小型の受信コイルを位置マーカーとし、その位置情報を送信チャネルから生成した交流磁界を用いて推定する。受信コイルの位置情報は5個の自由度を有しており、最低でも5個の送信チャネルがあればそれらの値を決定できるが、本システムでは送信チャネルに冗長性を持たせることで、受信コイルの回転などに対してもロバストな、より信頼性の高い位置推定が可能となった。これによって、音声発話時の調音運動を、より安定に精度よく測定することが可能となった。 発話データの取得に関しては、これまでも音素バランスを考慮した503個の短文章(ATR503文)を発話リストとして、複数の話者に対して測定実験をおこない、音声と調音運動の同時計測データを蓄積してきた。しかしながら、ATR503文はトータルで約20分程度の長さしかなく、必ずしも十分とはいえない。そこで、より大規模な発話データを取得することを目標として、新規に日本語発話リストの作成をおこなった。このリスト作成においては、統計的に三つ組音素の出現頻度を考慮した上で、なおかつ、将来のデータベース公開化に向けて、2次配布が可能なテキストデータを用いて設計をおこなった。男性話者1名を被験者として音声と調音運動の測定実験をおこない、約1時間規模の発話データを取得することができた。さらに、得られたデータを用い、調音運動と音声の特徴量の間の写像関係を特定する検討を進め、国際会議を含む研究発表をおこなった。
|