• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声データベースからの音声知識の発見

研究課題

研究課題/領域番号 10143203
研究種目

特定領域研究(A)

配分区分補助金
研究機関東北大学

研究代表者

牧野 正三  東北大学, 大型計算機センター, 教授 (00089806)

研究分担者 鈴木 基之  東北大学, 大型計算機センター, 助手 (30282015)
研究期間 (年度) 1998
研究課題ステータス 完了 (1998年度)
配分額 *注記
2,600千円 (直接経費: 2,600千円)
1998年度: 2,600千円 (直接経費: 2,600千円)
キーワード音声データベース / 自動音素ラベリング / 音素モデル / 音響類似性 / HMnet / 音声要約 / 共通区間検出
研究概要

現在,マルチメディア情報のライブラリ化が急速に進められている.音声情報においてもニュースなどを自動的にライブラリ化していくことが強く望まれている.自動ライブラリ化は,発声内容が文字情報として与えられている場合とそうでない場合に分けることができる.与えられている場合には,文字情報と音声情報を対応させることが必要であり,そうでない場合には,音声情報のみから話題の要約が必要になる.
本研究では,発声内容に関する文字情報が与えられた場合とそうでない場合に分けて研究を行った.文字情報が与えられた場合には,音声情報と言語情報を対応させるために,高精度な音素モデルと高精度な対応付けの方法が必要になる.文字情報が与えられない場合には,汎用の言語モデルや,音声区間の類似性を高速に計算する方法が必要になる.本年度はこれらの研究目的を達成するために,以下の3項目について研究を行った.
1. 音声情報と文字情報を対応させるための高精度音素モデルの自動構築法の開発.
2. 高精度音素モデルを用いた音声情報と文字情報の高精度対応づけ(自動音素ラベリング)の方法の開発.
3. 音響的類似性を利用した,発声内容をあらわすキーワードの自動抽出法の開発.
研究項目の1番目に関しては,従来利用されていた方法より高精度な音素モデルを自動的に構築することができた.この方法は事前に要因を規定する必要がないので,要因を規定できない言語モデルの獲得や認識単位の自動設定などへの応用も可能である.しかし,まだ十分なものとは言えず,一層の高精度化が必要である.研究項目の2番目に関しては,一層の高精度化にはパラメータの差分情報や周波数上の利用が必要である.研究項目の3番目に関しては,音響的類似性のみから高頻度で発声されている共通区間を自動的に抽出する手法を開発した.しかし,「〜ました」などの話題に依存しない単語も検出された.今後これらの付属語を除去するために,基本周波数情報や言語情報の利用が必要になると考えている.

報告書

(1件)
  • 1998 実績報告書
  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] 鈴木,原田,牧野,阿曽: "離散型HMnetを用いた言語モデルの獲得" 電子情報通信学会論文誌D-II. J81,12. 2695-2702 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 前田,鈴木,牧野: "連続音声の自動ラベリングにおけるHMnetとHMMの比較" 日本音響学会平成10年度秋季研究発表会講演論文集. 3-1-3. 87-88 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 前田,鈴木,牧野: "局所的特徴に着目した連続音声の自動ラベリング" 日本音響学会平成11年度春季研究発表会講演論文集. 3-Q-8. 133-134 (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 大河,鈴木,牧野: "複数音声データベースの音韻情報の共通化に関する検討" 日本音響学会平成11年度春季研究発表会講演論文集. 3-Q-30. 177-178 (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 鈴木,牧野: "離散型HMnetを用いた日本語文法構造の自動獲得" 人工知能学会人工知能基礎論研究資料. FAI-9803. 101-104 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Suzuki,Maeda,Makino: "Automatic Acquisition of Phoneme Models and Its Application to Phoneme Labeling of a Large Size of Speech Corpus" Proc.of Discovery Science '98. 437-438 (1998)

    • 関連する報告書
      1998 実績報告書

URL: 

公開日: 1998-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi