• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2002 年度 実績報告書

多言語に対応する音声入力インタフェースのための言語適応に関する基礎的研究

研究課題

研究課題/領域番号 13780302
研究機関千葉工業大学

研究代表者

大川 茂樹  千葉工業大学, 情報科学部, 助教授 (40306395)

キーワード音声言語処理 / 多言語情報処理 / 言語識別 / 音声認識 / 音韻性抽出 / 音声インタフェース / 音声データベース
研究概要

本研究は,世界の様々な自然言語(日本語や英語など)に共通して対応できる音声入力インタフェースを実現するために,対象とする言語とは別の音声データにより設計・構築された音声認識用モデルを当該の言語に「適応」する方法を検討し,その基礎的な知見を得ることを目指すものである.
研究2年目の今年度は,まず,言語適応化学習の検討および音声入力インタフェースの設計を行った.具体的には,日本語および英語の音声データベース(数百名以上の話者による大規模なもの)を基準モデルとして,多言語(中国語,フランス語,インドネシア語など)の少量の音声に対する言語適応化学習を行う音声入力インタフェースを作成した.この際,音韻体系の記述以外の言語モデル(文法等)は特に設定しなかったが,将来何らかの方法で多言語の文法記述およびその変換が行えるようになった場合にそのまま適用できるような音響モデルの設計を試みた.
次に,言語識別学習の検討として,上述のインタフェース設計から派生して,11の異なる言語の識別を行うシステムを設計し,1言語あたり100単語のデータベースを用いた簡単な言語識別実験を行った.この際,各言語の音響的特徴と言語的特徴とを効果的に抽出する方法を検討し,言語適応化における基礎モデルの設計に役立てることができた.
研究成果の一部は,日本音響学会2003年春季研究発表会(2003年3月18日〜20日,早稲田大学)にて「多言語識別における音韻性パターンの利用に関する検討」なる題目で発表した.また,フランスのコンピエーニュ工科大学との共同研究テーマと合わせて「Analysis of rhythm-based methods for language identification」なる報告書にまとめることができた.

  • 研究成果

    (5件)

すべて その他

すべて 文献書誌 (5件)

  • [文献書誌] 大川茂樹, 白井克彦: "特徴量レベルでの統合法に基づくマルチバンド型モデルによる雑音環境下音声認識"情報処理学会論文誌. 43-7. 2046-2054 (2002)

  • [文献書誌] 大川茂樹: "マルチバンド型音声認識のための相互情報量に基づく帯域分割"千葉工業大学研究報告理工編. 49. 129-135 (2002)

  • [文献書誌] Stephane Aubry, Shigeki Okawa: "Analysis of rhythm-based methods for language identification"千葉工業大学研究報告理工編. 50(掲載予定). (2003)

  • [文献書誌] 山下利樹, 川野涼子, 大川茂樹, Stephane Aubry: "多言語識別における音韻性パターンの利用に関する検討"日本音響学会講演論文集. 3-Q-8. 167-168 (2003)

  • [文献書誌] 川野涼子, 山下利樹, 長島健一, 大川茂樹: "音韻性抽出の原理に基づく音声の変異区間の推定"日本音響学会講演論文集. 3-Q-6. 163-164 (2003)

URL: 

公開日: 2004-04-07   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi