2002 Fiscal Year Annual Research Report
多言語に対応する音声入力インタフェースのための言語適応に関する基礎的研究
Project/Area Number |
13780302
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
大川 茂樹 千葉工業大学, 情報科学部, 助教授 (40306395)
|
Keywords | 音声言語処理 / 多言語情報処理 / 言語識別 / 音声認識 / 音韻性抽出 / 音声インタフェース / 音声データベース |
Research Abstract |
本研究は,世界の様々な自然言語(日本語や英語など)に共通して対応できる音声入力インタフェースを実現するために,対象とする言語とは別の音声データにより設計・構築された音声認識用モデルを当該の言語に「適応」する方法を検討し,その基礎的な知見を得ることを目指すものである. 研究2年目の今年度は,まず,言語適応化学習の検討および音声入力インタフェースの設計を行った.具体的には,日本語および英語の音声データベース(数百名以上の話者による大規模なもの)を基準モデルとして,多言語(中国語,フランス語,インドネシア語など)の少量の音声に対する言語適応化学習を行う音声入力インタフェースを作成した.この際,音韻体系の記述以外の言語モデル(文法等)は特に設定しなかったが,将来何らかの方法で多言語の文法記述およびその変換が行えるようになった場合にそのまま適用できるような音響モデルの設計を試みた. 次に,言語識別学習の検討として,上述のインタフェース設計から派生して,11の異なる言語の識別を行うシステムを設計し,1言語あたり100単語のデータベースを用いた簡単な言語識別実験を行った.この際,各言語の音響的特徴と言語的特徴とを効果的に抽出する方法を検討し,言語適応化における基礎モデルの設計に役立てることができた. 研究成果の一部は,日本音響学会2003年春季研究発表会(2003年3月18日〜20日,早稲田大学)にて「多言語識別における音韻性パターンの利用に関する検討」なる題目で発表した.また,フランスのコンピエーニュ工科大学との共同研究テーマと合わせて「Analysis of rhythm-based methods for language identification」なる報告書にまとめることができた.
|
Research Products
(5 results)
-
[Publications] 大川茂樹, 白井克彦: "特徴量レベルでの統合法に基づくマルチバンド型モデルによる雑音環境下音声認識"情報処理学会論文誌. 43-7. 2046-2054 (2002)
-
[Publications] 大川茂樹: "マルチバンド型音声認識のための相互情報量に基づく帯域分割"千葉工業大学研究報告理工編. 49. 129-135 (2002)
-
[Publications] Stephane Aubry, Shigeki Okawa: "Analysis of rhythm-based methods for language identification"千葉工業大学研究報告理工編. 50(掲載予定). (2003)
-
[Publications] 山下利樹, 川野涼子, 大川茂樹, Stephane Aubry: "多言語識別における音韻性パターンの利用に関する検討"日本音響学会講演論文集. 3-Q-8. 167-168 (2003)
-
[Publications] 川野涼子, 山下利樹, 長島健一, 大川茂樹: "音韻性抽出の原理に基づく音声の変異区間の推定"日本音響学会講演論文集. 3-Q-6. 163-164 (2003)