2005 Fiscal Year Annual Research Report

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

Research Project

Project/Area Number	17300064
Research Institution	Toyohashi University of Technology
Principal Investigator	中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)
Co-Investigator(Kenkyū-buntansha)	秋葉友良豊橋技術科学大学, 工学部, 助教授 (00356346) 北岡教英豊橋技術科学大学, 工学部, 講師 (10333501) 土屋雅稔豊橋技術科学大学, 工学部, 助手 (70378256) 小暮悟静岡大学, 情報学部, 助手 (40359758) 西崎博光山梨大学, 大学院・医学工学総合研究部, 助手 (40362082)
Keywords	音声認識 / 講義音声 / 音声ドキュメント / インデキシング / 音声要約
Research Abstract	本年度は、講演や講義の音声ドキュメントの高度利用化のために必要な要素技術である音声認識、音声要約、音声ドキュメントのセグメンテーション、音声ドキュメントのインディクス化の研究を行った。音声認識の高精度化のためには、我々の研究室で開発してきた大語彙連続音声認識システムSPOJUSの改良を行った。コンテキスト依存音響モデルとトライグラム言語モデルを1パス目に組み込むことにより、従来より認識精度を高めることができた。次に、実際の講義音声に対して、音声認識実験を行い、録音機材や音響モデル等による認識率の影響を検討した。さらに、講演音声や講義音声の要約の研究も行った。発話時間長、ピッチやパワー情報、ポーズ長、文の位置情報、手がかり語、重要語の出現頻度などを組み合わせることによる自動要約手法で、それぞれF値は、人間の要約と遜色のない0.599、0.524が得られた。また、講演音声や講義音声を音声認識システムで自動的に書き起こしたテキストデータに対しても要約を行い、音声認識による精度の低下は小さく比較的良い要約結果が得られた。講義音声のコンテンツ化の一貫として、講義音声の書き起こしテキストからキーワードを抽出しインデックスとすることも試みた。人手で書き起こしたテキストに対しては、ほぼ完壁にインデックスを作成することができた。静岡大学と山梨大学では、講義内容の動画の収集と音声の収集(DAT)を行った.現在,収録した動画から音声データを抽出し、書き起こし作業を人手で行っている。未知語や認識誤り等の対処法の検討については、文法による認識と平行して,ワードスポッティングを用いる音声認識手法についての検討を行った。また、講義や講演において、重要部分を発話するときに、平常音声と比べどのような音響的特徴の差異がでるのかを調べ、有意義な知見を得た。

Research Products
(7 results)

All 2006 2005

All Journal Article (6 results) Book (1 results)

[Journal Article] Text-independent/text-prompted speaker recognition by combining speaker-specific GMM with speaker adapted syllable-based HMM2006
- Author(s)
  S.Nakagawa, W.Zhang, M.Takahashi
- Journal Title
  
  Trans.IEICE, Information & Systems Vol.E89-D No.3
[Journal Article] Response timing detection using prosodic and linguistic information for human-freindly spoken dialog systems2005
- Author(s)
  N.Kitaoka, M.Takeuchi, R.Nishimura, S.Nakagawa
- Journal Title
  
  人工知能学会論文誌 Vol.20, No.3
  
  Pages: 220-228
[Journal Article] フォーム型Web情報検索サービスのための音声ユーザインタフェースシステムと操作性の評価2005
- Author(s)
  甲斐充彦, 盛浩和, 仲野崇広, 中川聖一
- Journal Title
  
  情報処理学会論文誌 Vol.46, No.5
  
  Pages: 1319-1329
[Journal Article] 日英関連報道記事を用いた訳語対応推定2005
- Author(s)
  宇津呂武彦, 日野浩平, 堀内貴司, 中川聖一
- Journal Title
  
  自然言語処理 Vol.12, No.5
  
  Pages: 43-68
[Journal Article] 表層的言語情報と韻律情報を用いた講演音声の重要文抽出2005
- Author(s)
  小林聡, 山口優, 中川聖一
- Journal Title
  
  自然言語処理 Vol.12, No.6
  
  Pages: 3-23
[Journal Article] CALLと音声情報処理技術2005
- Author(s)
  中川聖一
- Journal Title
  
  音声研究 Vol.9, No.2
  
  Pages: 28-37
[Book] Spoken Language Systems2005
- Author(s)
  S.Nakagawa, M.Okada, T.Kawahara
- Total Pages
  347
- Publisher
  Ohmsha, IOS Press

2005 Fiscal Year Annual Research Report

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

Principal Investigator

中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)

Research Products

[Journal Article] Text-independent/text-prompted speaker recognition by combining speaker-specific GMM with speaker adapted syllable-based HMM2006

Author(s)

Journal Title

[Journal Article] Response timing detection using prosodic and linguistic information for human-freindly spoken dialog systems2005

Author(s)

Journal Title

[Journal Article] フォーム型Web情報検索サービスのための音声ユーザインタフェースシステムと操作性の評価2005

Author(s)

Journal Title

[Journal Article] 日英関連報道記事を用いた訳語対応推定2005

Author(s)

Journal Title

[Journal Article] 表層的言語情報と韻律情報を用いた講演音声の重要文抽出2005

Author(s)

Journal Title

[Journal Article] CALLと音声情報処理技術2005

Author(s)

Journal Title

[Book] Spoken Language Systems2005

Author(s)

Total Pages

Publisher

中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)