多言語に対応する音声入力インタフェースのための言語適応に関する基礎的研究

Research Project

Project/Area Number	13780302
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Chiba Institute of Technology
Principal Investigator	大川茂樹千葉工業大学, 情報科学部, 助教授 (40306395)
Project Period (FY)	2001 – 2002
Project Status	Completed (Fiscal Year 2002)
Budget Amount *help	¥2,100,000 (Direct Cost: ¥2,100,000) Fiscal Year 2002: ¥1,000,000 (Direct Cost: ¥1,000,000) Fiscal Year 2001: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords	音声言語処理 / 多言語情報処理 / 言語識別 / 音声認識 / 音韻性抽出 / 音声インタフェース / 音声データベース / 多言語音声処理 / 実環境音声認識 / ヒューマンインタフェース
Research Abstract	本研究は,世界の様々な自然言語(日本語や英語など)に共通して対応できる音声入力インタフェースを実現するために,対象とする言語とは別の音声データにより設計・構築された音声認識用モデルを当該の言語に「適応」する方法を検討し,その基礎的な知見を得ることを目指すものである. 研究2年目の今年度は,まず,言語適応化学習の検討および音声入力インタフェースの設計を行った.具体的には,日本語および英語の音声データベース(数百名以上の話者による大規模なもの)を基準モデルとして,多言語(中国語,フランス語,インドネシア語など)の少量の音声に対する言語適応化学習を行う音声入力インタフェースを作成した.この際,音韻体系の記述以外の言語モデル(文法等)は特に設定しなかったが,将来何らかの方法で多言語の文法記述およびその変換が行えるようになった場合にそのまま適用できるような音響モデルの設計を試みた. 次に,言語識別学習の検討として,上述のインタフェース設計から派生して,11の異なる言語の識別を行うシステムを設計し,1言語あたり100単語のデータベースを用いた簡単な言語識別実験を行った.この際,各言語の音響的特徴と言語的特徴とを効果的に抽出する方法を検討し,言語適応化における基礎モデルの設計に役立てることができた. 研究成果の一部は,日本音響学会2003年春季研究発表会(2003年3月18日〜20日,早稲田大学)にて「多言語識別における音韻性パターンの利用に関する検討」なる題目で発表した.また,フランスのコンピエーニュ工科大学との共同研究テーマと合わせて「Analysis of rhythm-based methods for language identification」なる報告書にまとめることができた.

Report

(2 results)

2002 Annual Research Report
2001 Annual Research Report

Research Products
(9 results)

All Other

All Publications (9 results)

[Publications] 大川茂樹, 白井克彦: "特徴量レベルでの統合法に基づくマルチバンド型モデルによる雑音環境下音声認識"情報処理学会論文誌. 43-7. 2046-2054 (2002)
- Related Report
  2002 Annual Research Report
[Publications] 大川茂樹: "マルチバンド型音声認識のための相互情報量に基づく帯域分割"千葉工業大学研究報告理工編. 49. 129-135 (2002)
- Related Report
  2002 Annual Research Report
[Publications] Stephane Aubry, Shigeki Okawa: "Analysis of rhythm-based methods for language identification"千葉工業大学研究報告理工編. 50(掲載予定). (2003)
- Related Report
  2002 Annual Research Report
[Publications] 山下利樹, 川野涼子, 大川茂樹, Stephane Aubry: "多言語識別における音韻性パターンの利用に関する検討"日本音響学会講演論文集. 3-Q-8. 167-168 (2003)
- Related Report
  2002 Annual Research Report
[Publications] 川野涼子, 山下利樹, 長島健一, 大川茂樹: "音韻性抽出の原理に基づく音声の変異区間の推定"日本音響学会講演論文集. 3-Q-6. 163-164 (2003)
- Related Report
  2002 Annual Research Report
[Publications] 大川茂樹: "普遍的制約に基づく日本語音韻の特徴抽出のための統計的手法"千葉工業大学研究報告理工編. 48. 65-71 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 大川茂樹, 塩田大輔, 白井克彦, 長島健一: "マルチバンド型音声認識における相互情報量に基づく帯域分割点の最適化"日本音響学会講演論文集. 1-Q-5. 169-170 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 長島健一, 川野涼子, 大川茂樹, 安田清: "マヒ性構音障害音声の認識を目指した音声特徴の分析"日本音響学会講演論文集. 3-P-1(発表予定). (2002)
- Related Report
  2001 Annual Research Report
[Publications] 塩田大輔, 王大司, 大川茂樹, 白井克彦: "様々な雑音環境下におけるマルチバンド型音声認識の性能評価"日本音響学会講演論文集. 3-P-4(発表予定). (2002)
- Related Report
  2001 Annual Research Report

多言語に対応する音声入力インタフェースのための言語適応に関する基礎的研究

Principal Investigator

大川 茂樹 千葉工業大学, 情報科学部, 助教授 (40306395)

¥2,100,000 (Direct Cost: ¥2,100,000)

Report

Research Products

[Publications] 大川茂樹, 白井克彦: "特徴量レベルでの統合法に基づくマルチバンド型モデルによる雑音環境下音声認識"情報処理学会論文誌. 43-7. 2046-2054 (2002)

Related Report

[Publications] 大川茂樹: "マルチバンド型音声認識のための相互情報量に基づく帯域分割"千葉工業大学研究報告理工編. 49. 129-135 (2002)

Related Report

[Publications] Stephane Aubry, Shigeki Okawa: "Analysis of rhythm-based methods for language identification"千葉工業大学研究報告理工編. 50(掲載予定). (2003)

Related Report

[Publications] 山下利樹, 川野涼子, 大川茂樹, Stephane Aubry: "多言語識別における音韻性パターンの利用に関する検討"日本音響学会講演論文集. 3-Q-8. 167-168 (2003)

Related Report

[Publications] 川野涼子, 山下利樹, 長島健一, 大川茂樹: "音韻性抽出の原理に基づく音声の変異区間の推定"日本音響学会講演論文集. 3-Q-6. 163-164 (2003)

Related Report

[Publications] 大川 茂樹: "普遍的制約に基づく日本語音韻の特徴抽出のための統計的手法"千葉工業大学研究報告理工編. 48. 65-71 (2001)

Related Report

[Publications] 大川茂樹, 塩田大輔, 白井克彦, 長島健一: "マルチバンド型音声認識における相互情報量に基づく帯域分割点の最適化"日本音響学会 講演論文集. 1-Q-5. 169-170 (2001)

Related Report

[Publications] 長島健一, 川野涼子, 大川茂樹, 安田清: "マヒ性構音障害音声の認識を目指した音声特徴の分析"日本音響学会 講演論文集. 3-P-1(発表予定). (2002)

Related Report

[Publications] 塩田大輔, 王大司, 大川茂樹, 白井克彦: "様々な雑音環境下におけるマルチバンド型音声認識の性能評価"日本音響学会 講演論文集. 3-P-4(発表予定). (2002)

Related Report

大川茂樹千葉工業大学, 情報科学部, 助教授 (40306395)

[Publications] 大川茂樹: "普遍的制約に基づく日本語音韻の特徴抽出のための統計的手法"千葉工業大学研究報告理工編. 48. 65-71 (2001)

[Publications] 大川茂樹, 塩田大輔, 白井克彦, 長島健一: "マルチバンド型音声認識における相互情報量に基づく帯域分割点の最適化"日本音響学会講演論文集. 1-Q-5. 169-170 (2001)

[Publications] 長島健一, 川野涼子, 大川茂樹, 安田清: "マヒ性構音障害音声の認識を目指した音声特徴の分析"日本音響学会講演論文集. 3-P-1(発表予定). (2002)

[Publications] 塩田大輔, 王大司, 大川茂樹, 白井克彦: "様々な雑音環境下におけるマルチバンド型音声認識の性能評価"日本音響学会講演論文集. 3-P-4(発表予定). (2002)