2006 Fiscal Year Annual Research Report
時期差・時間差・気分による音声変動の解明と分散型話者認識への応用に関する研究
Project/Area Number |
17300065
|
Research Institution | The University of Tokushima |
Principal Investigator |
黒岩 眞吾 徳島大学, 大学院ソシオテクノサイエンス研究部, 助教授 (20333510)
|
Co-Investigator(Kenkyū-buntansha) |
北 研二 徳島大学, 高度情報化基盤センター, 教授 (10243734)
任 福継 徳島大学, 大学院ソシオテクノサイエンス研究部, 教授 (20264947)
柘植 覚 徳島大学, 大学院ソシオテクノサイエンス研究部, 講師 (00325250)
|
Keywords | 音声学 / 音声データベース / 話者認識 / 話者識別 / 話者照合 / 分散型話者認識 / 分散型話者照合 / 音声変動 |
Research Abstract |
データベース収集に関わる研究開発、収集したデータの分析、分散型話者認識手法の研究開発を行った。研究項目毎の研究実績の概要を以下に示す。 (1)朝昼晩音声データの収集と音声データベースの構築 週1日、朝昼晩の3回、音素バランス文50文を4名の話者が簡易防音室内で発声した音声の収集を続けている。昨年度に開発したツールを用い、現在までに,女性1名、男性2名の3年分のデータについて、データベース化を終了した。 (2)時期差・時間差・気分による音声変化の分析 収集した音声データベースのうち,女性話者1名のデータを用い発声回毎に音響モデルを作成し音声認識実験を行うことで、時期差・時間差・気分等の要因が認識率に与える影響を調査した。血圧、体温、前日の睡眠時間、自己申告の気分等と認識率に「関係があるとはいえない」ことが明らかとなる一方で、発声速度が認識率に与える影響の大きいことが明らかとなった。 (3)分散型話者認識手法の研究開発 情報圧縮に頑健な話者認識手法としてEarth Mover's Distance(EMD)とベクトル量子化を統合したノンパラメトリックな話者認識手法が国際会議ISCSLP2007の話者識別コンテストの回線特性クローズ部門で1位の成績を修めた。また、多次元距離尺度EMDの高速化アルゴリズムを開発し、従来の10分の1程度の計算量を達成した。さらに、提案手法を話者照合に適用するための判別手法を考案し、従来型の閾値を用いる方法に比べ誤りを半減できることを確認した(ただし、計算量は膨大)。 (4)音声言語情報からの感性情報抽出法の研究開発 人間の感情を内的状態と外部刺激により確率的に表現する「心的状態遷移ネットワーク」の遷移確率学習法を考案し、アンケート調査に基づき心的状態遷移ネットワークを構築した。また、感情別テキストコーパスを用いた感情推定アルゴリズムを考案した。
|
Research Products
(9 results)