2007 Fiscal Year Annual Research Report

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

Research Project

Project/Area Number	17300064
Research Institution	Toyohashi University of Technology
Principal Investigator	中川聖一 Toyohashi University of Technology, 工学部, 教授 (20115893)
Co-Investigator(Kenkyū-buntansha)	秋葉友良豊橋技術科学大学, 工学部, 准教授 (00356346) 土屋雅稔豊橋技術科学大学, 工学部, 助教 (70378256) 北岡教英名古屋大学大学院, 情報科学研究科, 准教授 (10333501) 小暮悟静岡大学, 情報学部, 助教 (40359758) 西崎博光山梨大学, 大学院・医学工学総合研究部, 助教 (40362082)
Keywords	講義音声 / 音声認識 / 話し言葉 / 言語モデル / 音声要約 / インデキシング / 音声検索 / ブラウジング
Research Abstract	大学の学部・大学院の講義音声を収録し,データベース化・公開した。収録した講義は,話者16名,114コマ,3,860分で,そのうち書き起こしデータを付与したものが,話者15名,97コマ,3,685分である。話し言葉用の言語モデルの構築のために,フィラー等を含まない整形されたテキストコーパスや書き言葉コーパスに対し,フィラーの予測、挿入モデルを開発し,パープレキシティの減少と音声認識率の向上を得た。また,Webテキストを用いた言語モデルの適応,キーワードの出現頻度を強調した言語モデルなども検討した。音声認識用の辞書は,短単語登録を基本としているのに対し,キーワードは複合語が多いので,複合語のキーワードにも対処したキーワード抽出を行った。スライド中のキーワードは30%程度しか発話されていないので,書き起こしテキストからキーワードを抽出し,インデキシング化する方法と併用した。講義音声の音声認識,音声要約,インデキシング機能を統合して,講義音声のブラウジングシステムを構築した。市販の講義収録システム(EZ-プレゼンテーター)をもとに,書き起こしテキストの表示,再生音声と同期したテキストのハイライト,要約率の指定による重要文だけの提示,スライドおよび書き起こしテキストからのキーワードの抽出一覧とそれによるビデオの頭出しの機能,音声再生速度の可変機能の組込み,などを行い,被験者実験により評価し,有効性を示した。

Research Products
(9 results)

All 2008 2007

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (8 results)

[Journal Article] 講義音声ドキュメンのコンテンツ化と視聴システム2008
- Author(s)
  中川聖一, 富樫慎吾, 山口優, 藤井康寿, 北岡教英
- Journal Title
  
  電子情報通信学会論文誌 Vol. 91-D
  
  Pages: 238-249
- Peer Reviewed
[Presentation] フィラー予測モデルを用いた話し言葉言語モデルの音声認識による評価2008
- Author(s)
  太田健吾, 土屋雅稔, 中川聖一
- Organizer
  第2回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  豊橋
- Year and Date
  20080200
- Description
  「研究成果報告書概要(和文)」より
[Presentation] 講義音声ドキュメントのコンテンツ化とブラウジングシステムの改良2008
- Author(s)
  富樫慎吾, 中川聖一
- Organizer
  第2回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  豊橋
- Year and Date
  20080200
- Description
  「研究成果報告書概要(和文)」より
[Presentation] 日本語講義音声コンテンツコーパスの構築と講義音声認識手法の検討2008
- Author(s)
  小暮悟, 西崎博光, 土屋雅稔, 富樫慎吾, 山本一公, 中川聖一
- Organizer
  第2回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  豊橋
- Year and Date
  20080200
- Description
  「研究成果報告書概要(和文)」より
[Presentation] 講義音声認識のためのWEB文書を用いた言語モデルの適応化と語彙選択2008
- Author(s)
  徳田翔, 西崎博光, 関口芳廣
- Organizer
  第2回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  豊橋
- Year and Date
  20080200
- Description
  「研究成果報告書概要(和文)」より
[Presentation] 講義音声の自動評価のための各種特徴量の調査2008
- Author(s)
  小林健司, 宗宮充宏, 名取賢, 西崎博光
- Organizer
  第2回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  豊橋
- Year and Date
  20080200
- Description
  「研究成果報告書概要(和文)」より
[Presentation] 固有表現検出を用いた認識誤りに頑健な音声ドキュメント質問応答2008
- Author(s)
  秋葉友良, 辻村裕史
- Organizer
  第2回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  豊橋
- Year and Date
  20080200
- Description
  「研究成果報告書概要(和文)」より
[Presentation] 認識候補から正解テキストへの翻訳モデルに基づく講演音声ドキュメントのアドホック検索2008
- Author(s)
  秋葉友良, 横田悠右
- Organizer
  第2回音声ドキュメント処理ワークショップ講演論文集
- Place of Presentation
  豊橋
- Year and Date
  20080200
- Description
  「研究成果報告書概要(和文)」より
[Presentation] 講義音声収録映像の音声情報を用いた講義コンテンツの構築と評価2007
- Author(s)
  富樫慎吾, 中川聖一
- Organizer
  日本音響学会秋季講演論文集
- Place of Presentation
  甲府
- Year and Date
  20070900

2007 Fiscal Year Annual Research Report

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

Principal Investigator

中川 聖一 Toyohashi University of Technology, 工学部, 教授 (20115893)

Research Products

[Journal Article] 講義音声ドキュメンのコンテンツ化と視聴システム2008

Author(s)

Journal Title

[Presentation] フィラー予測モデルを用いた話し言葉言語モデルの音声認識による評価2008

Author(s)

Organizer

Place of Presentation

Year and Date

Description

[Presentation] 講義音声ドキュメントのコンテンツ化とブラウジングシステムの改良2008

Author(s)

Organizer

Place of Presentation

Year and Date

Description

[Presentation] 日本語講義音声コンテンツコーパスの構築と講義音声認識手法の検討2008

Author(s)

Organizer

Place of Presentation

Year and Date

Description

[Presentation] 講義音声認識のためのWEB文書を用いた言語モデルの適応化と語彙選択2008

Author(s)

Organizer

Place of Presentation

Year and Date

Description

[Presentation] 講義音声の自動評価のための各種特徴量の調査2008

Author(s)

Organizer

Place of Presentation

Year and Date

Description

[Presentation] 固有表現検出を用いた認識誤りに頑健な音声ドキュメント質問応答2008

Author(s)

Organizer

Place of Presentation

Year and Date

Description

[Presentation] 認識候補から正解テキストへの翻訳モデルに基づく講演音声ドキュメントのアドホック検索2008

Author(s)

Organizer

Place of Presentation

Year and Date

Description

[Presentation] 講義音声収録映像の音声情報を用いた講義コンテンツの構築と評価2007

Author(s)

Organizer

Place of Presentation

Year and Date

中川聖一 Toyohashi University of Technology, 工学部, 教授 (20115893)