音声データベースからの音声知識の発見

Research Project

Project/Area Number	10143203
Research Category	Grant-in-Aid for Scientific Research on Priority Areas (A)
Allocation Type	Single-year Grants
Research Institution	Tohoku University
Principal Investigator	牧野正三東北大学, 大型計算機センター, 教授 (00089806)
Co-Investigator(Kenkyū-buntansha)	鈴木基之東北大学, 大型計算機センター, 助手 (30282015)
Project Period (FY)	1998
Project Status	Completed (Fiscal Year 1998)
Budget Amount *help	¥2,600,000 (Direct Cost: ¥2,600,000) Fiscal Year 1998: ¥2,600,000 (Direct Cost: ¥2,600,000)
Keywords	音声データベース / 自動音素ラベリング / 音素モデル / 音響類似性 / HMnet / 音声要約 / 共通区間検出
Research Abstract	現在,マルチメディア情報のライブラリ化が急速に進められている.音声情報においてもニュースなどを自動的にライブラリ化していくことが強く望まれている.自動ライブラリ化は,発声内容が文字情報として与えられている場合とそうでない場合に分けることができる.与えられている場合には,文字情報と音声情報を対応させることが必要であり,そうでない場合には,音声情報のみから話題の要約が必要になる. 本研究では,発声内容に関する文字情報が与えられた場合とそうでない場合に分けて研究を行った.文字情報が与えられた場合には,音声情報と言語情報を対応させるために,高精度な音素モデルと高精度な対応付けの方法が必要になる.文字情報が与えられない場合には,汎用の言語モデルや,音声区間の類似性を高速に計算する方法が必要になる.本年度はこれらの研究目的を達成するために,以下の3項目について研究を行った. 1. 音声情報と文字情報を対応させるための高精度音素モデルの自動構築法の開発. 2. 高精度音素モデルを用いた音声情報と文字情報の高精度対応づけ(自動音素ラベリング)の方法の開発. 3. 音響的類似性を利用した,発声内容をあらわすキーワードの自動抽出法の開発. 研究項目の1番目に関しては,従来利用されていた方法より高精度な音素モデルを自動的に構築することができた.この方法は事前に要因を規定する必要がないので,要因を規定できない言語モデルの獲得や認識単位の自動設定などへの応用も可能である.しかし,まだ十分なものとは言えず,一層の高精度化が必要である.研究項目の2番目に関しては,一層の高精度化にはパラメータの差分情報や周波数上の利用が必要である.研究項目の3番目に関しては,音響的類似性のみから高頻度で発声されている共通区間を自動的に抽出する手法を開発した.しかし,「〜ました」などの話題に依存しない単語も検出された.今後これらの付属語を除去するために,基本周波数情報や言語情報の利用が必要になると考えている.

Report

(1 results)

1998 Annual Research Report

Research Products
(6 results)

All Other

All Publications (6 results)

[Publications] 鈴木,原田,牧野,阿曽: "離散型HMnetを用いた言語モデルの獲得" 電子情報通信学会論文誌D-II. J81,12. 2695-2702 (1998)
- Related Report
  1998 Annual Research Report
[Publications] 前田,鈴木,牧野: "連続音声の自動ラベリングにおけるHMnetとHMMの比較" 日本音響学会平成10年度秋季研究発表会講演論文集. 3-1-3. 87-88 (1998)
- Related Report
  1998 Annual Research Report
[Publications] 前田,鈴木,牧野: "局所的特徴に着目した連続音声の自動ラベリング" 日本音響学会平成11年度春季研究発表会講演論文集. 3-Q-8. 133-134 (1999)
- Related Report
  1998 Annual Research Report
[Publications] 大河,鈴木,牧野: "複数音声データベースの音韻情報の共通化に関する検討" 日本音響学会平成11年度春季研究発表会講演論文集. 3-Q-30. 177-178 (1999)
- Related Report
  1998 Annual Research Report
[Publications] 鈴木,牧野: "離散型HMnetを用いた日本語文法構造の自動獲得" 人工知能学会人工知能基礎論研究資料. FAI-9803. 101-104 (1998)
- Related Report
  1998 Annual Research Report
[Publications] Suzuki,Maeda,Makino: "Automatic Acquisition of Phoneme Models and Its Application to Phoneme Labeling of a Large Size of Speech Corpus" Proc.of Discovery Science '98. 437-438 (1998)
- Related Report
  1998 Annual Research Report

音声データベースからの音声知識の発見

Principal Investigator

牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)

¥2,600,000 (Direct Cost: ¥2,600,000)

Report

Research Products

[Publications] 鈴木,原田,牧野,阿曽: "離散型HMnetを用いた言語モデルの獲得" 電子情報通信学会論文誌D-II. J81,12. 2695-2702 (1998)

Related Report

[Publications] 前田,鈴木,牧野: "連続音声の自動ラベリングにおけるHMnetとHMMの比較" 日本音響学会平成10年度秋季研究発表会講演論文集. 3-1-3. 87-88 (1998)

Related Report

[Publications] 前田,鈴木,牧野: "局所的特徴に着目した連続音声の自動ラベリング" 日本音響学会平成11年度春季研究発表会講演論文集. 3-Q-8. 133-134 (1999)

Related Report

[Publications] 大河,鈴木,牧野: "複数音声データベースの音韻情報の共通化に関する検討" 日本音響学会平成11年度春季研究発表会講演論文集. 3-Q-30. 177-178 (1999)

Related Report

[Publications] 鈴木,牧野: "離散型HMnetを用いた日本語文法構造の自動獲得" 人工知能学会人工知能基礎論研究資料. FAI-9803. 101-104 (1998)

Related Report

[Publications] Suzuki,Maeda,Makino: "Automatic Acquisition of Phoneme Models and Its Application to Phoneme Labeling of a Large Size of Speech Corpus" Proc.of Discovery Science '98. 437-438 (1998)

Related Report

牧野正三東北大学, 大型計算機センター, 教授 (00089806)