2001 Fiscal Year Annual Research Report
多言語に対応する音声入力インタフェースのための言語適応に関する基礎的研究
Project/Area Number |
13780302
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
大川 茂樹 千葉工業大学, 情報科学部, 助教授 (40306395)
|
Keywords | 音声認識 / 多言語音声処理 / 実環境音声認識 / ヒューマンインタフェース |
Research Abstract |
本研究は,世界の様々な自然言語(日本語や英語など)に共通して対応できる音声入力インタフェースを実現するために,対象とする言語とは別の音声データにより設計・構築された音声認識用モデルを当該の言語に「適応」する方法を検討し,その基礎的な知見を得ることを目指すものである. 今年度は,まず,音声認識において発声された音声信号に含まれる音響的情報をボトムアップに抽出する処理と,文法や意味などの情報をトップダウンに適用する処理とを統合して用いる方法を検討するため,音声信号の音響的特徴からの音韻性抽出技術について検討した.具体的には,従来から検討を進めている「マルチバンド音声認識」と呼ばれる認識手法について,特に雑音下という環境を考慮した上で,認識アルゴリズムの改善および様々な条件での認識実験を行い,性能を評価した.文法や意味情報の共通したモデル化が困難である多言語の処理において,実験結果から得られた知見が有用である. 次に,多言語音声入力インタフェースを検討するために,でき,る限り多くの言語音声データを収集し,それらの音響的特徴や音韻構造などの情報を調査・分析した.さらに,複数の言語の音声データに対して(i)単純に混合して学習,(ii)各々を独立に学習,(iii)言語適応化学習,の3通りの学習方法によりボトムアップ情報を用いた音韻モデルを作成し,音韻識別性能を検討した.具体的には,比較的入手が容易な英語,日本語に加えて,モンゴル語の音声データを収集し,上記のボトムアップ情報を用いた音韻性抽出実験を行った.この結果より,言語による音声特徴のバラツキ(分散)や相関性について検討することができた.
|
Research Products
(4 results)
-
[Publications] 大川 茂樹: "普遍的制約に基づく日本語音韻の特徴抽出のための統計的手法"千葉工業大学研究報告理工編. 48. 65-71 (2001)
-
[Publications] 大川茂樹, 塩田大輔, 白井克彦, 長島健一: "マルチバンド型音声認識における相互情報量に基づく帯域分割点の最適化"日本音響学会 講演論文集. 1-Q-5. 169-170 (2001)
-
[Publications] 長島健一, 川野涼子, 大川茂樹, 安田清: "マヒ性構音障害音声の認識を目指した音声特徴の分析"日本音響学会 講演論文集. 3-P-1(発表予定). (2002)
-
[Publications] 塩田大輔, 王大司, 大川茂樹, 白井克彦: "様々な雑音環境下におけるマルチバンド型音声認識の性能評価"日本音響学会 講演論文集. 3-P-4(発表予定). (2002)