講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

研究課題

研究課題/領域番号	17300064
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知覚情報処理・知能ロボティクス
研究機関	豊橋技術科学大学
研究代表者	中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)
研究分担者	秋葉友良豊橋技術科学大学, 工学部, 准教授 (00356346) 土屋雅稔豊橋技術科学大学, 工学部, 助教 (70378256) 北岡教英名古屋大学, 大学院・情報科学研究科, 准教授 (10333501) 小暮悟静岡大学, 情報学部, 助教 (40359758) 西崎博光山梨大学, 大学院・医学工学総合研究部, 助教 (40362082)
研究期間 (年度)	2005 – 2007
研究課題ステータス	完了 (2007年度)
配分額 *注記	16,030千円 (直接経費: 14,800千円、間接経費: 1,230千円) 2007年度: 5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円) 2006年度: 3,900千円 (直接経費: 3,900千円) 2005年度: 6,800千円 (直接経費: 6,800千円)
キーワード	講義音声 / 音声認識 / 話し言葉 / 言語モデル / 音声要約 / インデキシング / 音声検索 / ブラウジング / 音声ドキュメント
研究概要	大学の学部・大学院の講義音声を収録し、データベース化・公開した。収録した講義は、話者16名、114コマ、3,860分で、そのうち書き起こしデータを付与したものが、話者15名、97コマ、3,685分である。話し言葉用の言語モデルの構築のために、フィラー等を含まない整形されたテキストコーパスや書き言葉コーパスに対し、フィラーの予測・挿入モデルを開発し、パープレキシティの減少と音声認識率の向上を得た。また、Webテキストを用いた言語モデルの適応、キーワードの出現頻度を強調した言語モデルなども検討した。音声認識用の辞書は、短単語登録を基本としているのに対し、キーワードは複合語が多いので、複合語のキーワードにも対処したキーワード抽出を行った。スライド中のキーワードは30%程度しか発話されていないので、書き起こしテキストからキーワードを抽出し、インデキシング化する方法と併用した。講義音声の音声認識、音声要約、インデキシング機能を統合して、講義音声のブラウジングシステムを構築した。市販の講義収録システム(EZ-プレゼンテーター)をもとに、書き起こしテキストの表示、再生音声と同期したテキストのハイライト、要約率の指定による重要文だけの提示、スライドおよび書き起こしテキストからのキーワードの抽出一覧とそれによるビデオの頭出しの機能、音声再生速度の可変機能の組込み、などを行い、被験者実験により評価し、有効性を示した。

報告書

(4件)

研究成果
(30件)

すべて 2008 2007 2006 2005 その他

すべて雑誌論文 (15件) (うち査読あり 1件) 学会発表 (13件) 図書 (1件) 備考 (1件)

[雑誌論文] 講義音声ドキュメントのコンテンツ化と視聴システム2008
- 著者名/発表者名
  中川聖一, 富樫慎吾, 山口優, 藤井康寿, 北岡教英
- 雑誌名
  
  電子情報通信学会論文誌 Vol.91-D
  
  ページ: 238-249
- NAID
  110007385909
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 研究成果報告書概要
[雑誌論文] Useful Contents of Classroom Lecture Speech and Browsing System(in Japanese)2008
- 著者名/発表者名
  S. Nakagawa, S. Togashi, M. Yamaguchi, Y. Fujii N. Kitaoka
- 雑誌名
  
  IEICE Trans. Information and Systerns J91-D, 2
  
  ページ: 238-248
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[雑誌論文] 講義音声ドキュメンのコンテンツ化と視聴システム2008
- 著者名/発表者名
  中川聖一, 富樫慎吾, 山口優, 藤井康寿, 北岡教英
- 雑誌名
  
  電子情報通信学会論文誌 Vol. 91-D
  
  ページ: 238-249
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] 機械学習を用いた日本語機能表現のチャンキング2007
- 著者名/発表者名
  土屋雅稔, 注連隆夫, 高木俊宏, 内元清貴, 松吉俊, 宇津呂武仁, 佐藤理史, 中川聖一
- 雑誌名
  
  自然言語処理 Vol.14 No.1
  
  ページ: 111-138
- NAID
  10018504343
- 関連する報告書
  2006 実績報告書
[雑誌論文] 講義ドキュメントのコンテンツ化と視聴システムの試作2007
- 著者名/発表者名
  富樫慎吾, 藤井康寿, 北岡教英, 中川聖一
- 雑誌名
  
  第1回音声ドキュメント処理ワークショップ講演論文集
  
  ページ: 17-24
- 関連する報告書
  2006 実績報告書
[雑誌論文] 講義コンテンツの収集・分析および講義音声の認識手法に関する検討2007
- 著者名/発表者名
  小暮悟, 西崎博光, 土屋雅稔, 中川聖一
- 雑誌名
  
  第1回音声ドキュメント処理ワークショップ講演論文集
  
  ページ: 1-8
- NAID
  40016334727
- 関連する報告書
  2006 実績報告書
[雑誌論文] 日本語複合辞書用例データベースの作成と分析2006
- 著者名/発表者名
  土屋雅稔, 宇津呂武仁, 松吉俊, 佐藤理史, 中川聖一
- 雑誌名
  
  情報処理学会論文誌 47(6)
  
  ページ: 1728-1742
- 関連する報告書
  2006 実績報告書
[雑誌論文] Robust Distant Speech Recognition by Combining Multiple Microhone-array Processing with Position Dependent CMN2006
- 著者名/発表者名
  L.Wang, N.Kitaoka, S.Nakagawa
- 雑誌名
  
  Eurasip Journal on Applied Signal Processing (95491)
  
  ページ: 1-11
- 関連する報告書
  2006 実績報告書
[雑誌論文] 音声対話機能を備えた音色識別学習支援システム2006
- 著者名/発表者名
  渡辺裕太, 瀾口芳廣, 西崎博光
- 雑誌名
  
  情報処理学会論文誌 Vol.42 No.12
  
  ページ: 3173-3184
- NAID
  110004729743
- 関連する報告書
  2006 実績報告書
[雑誌論文] Text-independent/text-prompted speaker recognition by combining speaker-specific GMM with speaker adapted syllable-based HMM2006
- 著者名/発表者名
  S.Nakagawa, W.Zhang, M.Takahashi
- 雑誌名
  
  Trans.IEICE, Information & Systems Vol.E89-D No.3
- NAID
  110004719381
- 関連する報告書
  2005 実績報告書
[雑誌論文] Response timing detection using prosodic and linguistic information for human-freindly spoken dialog systems2005
- 著者名/発表者名
  N.Kitaoka, M.Takeuchi, R.Nishimura, S.Nakagawa
- 雑誌名
  
  人工知能学会論文誌 Vol.20, No.3
  
  ページ: 220-228
- 関連する報告書
  2005 実績報告書
[雑誌論文] フォーム型Web情報検索サービスのための音声ユーザインタフェースシステムと操作性の評価2005
- 著者名/発表者名
  甲斐充彦, 盛浩和, 仲野崇広, 中川聖一
- 雑誌名
  
  情報処理学会論文誌 Vol.46, No.5
  
  ページ: 1319-1329
- NAID
  110002768637
- 関連する報告書
  2005 実績報告書
[雑誌論文] 日英関連報道記事を用いた訳語対応推定2005
- 著者名/発表者名
  宇津呂武彦, 日野浩平, 堀内貴司, 中川聖一
- 雑誌名
  
  自然言語処理 Vol.12, No.5
  
  ページ: 43-68
- NAID
  130004291858
- 関連する報告書
  2005 実績報告書
[雑誌論文] 表層的言語情報と韻律情報を用いた講演音声の重要文抽出2005
- 著者名/発表者名
  小林聡, 山口優, 中川聖一
- 雑誌名
  
  自然言語処理 Vol.12, No.6
  
  ページ: 3-23
- NAID
  10016863571
- 関連する報告書
  2005 実績報告書
[雑誌論文] CALLと音声情報処理技術2005
- 著者名/発表者名
  中川聖一
- 雑誌名
  
  音声研究 Vol.9, No.2
  
  ページ: 28-37
- 関連する報告書
  2005 実績報告書
[学会発表] フィラー予測モデルを用いた話し言葉言語モデルの音声認識による評価2008
- 著者名/発表者名
  太田健吾, 土屋雅稔, 中川聖一
- 学会等名
  第2回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  豊橋
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 実績報告書 2007 研究成果報告書概要
[学会発表] 講義音声ドキュメントのコンテンツ化とブラウジングシステムの改良2008
- 著者名/発表者名
  富樫慎吾, 中川聖一
- 学会等名
  第2回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  豊橋
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 実績報告書 2007 研究成果報告書概要
[学会発表] 日本語講義音声コンテンツコーパスの構築と講義音声認識手法の検討2008
- 著者名/発表者名
  小暮悟, 西崎博光, 土屋雅稔, 富樫慎吾, 山本一公, 中川聖一
- 学会等名
  第2回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  豊橋
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 実績報告書 2007 研究成果報告書概要
[学会発表] 講義音声認識のためのWEB文書を用いた言語モデルの適応化と語彙選択2008
- 著者名/発表者名
  徳田翔, 西崎博光, 関口芳廣
- 学会等名
  第2回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  豊橋
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 実績報告書 2007 研究成果報告書概要
[学会発表] 講義音声の自動評価のための各種特徴量の調査2008
- 著者名/発表者名
  小林健司, 宗宮充宏, 名取賢, 西崎博光
- 学会等名
  第2回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  豊橋
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 実績報告書 2007 研究成果報告書概要
[学会発表] 固有表現検出を用いた認識誤りに頑健な音声ドキュメント質問応答2008
- 著者名/発表者名
  秋葉友良, 辻村裕史
- 学会等名
  第2回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  豊橋
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 実績報告書 2007 研究成果報告書概要
[学会発表] 認識候補から正解テキストへの翻訳モデルに基づく講演音声ドキュメントのアドホック検索2008
- 著者名/発表者名
  秋葉友良, 横田悠右
- 学会等名
  第2回音声ドキュメント処理ワークショップ講演論文集
- 発表場所
  豊橋
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 実績報告書 2007 研究成果報告書概要
[学会発表] LVCSR based on context dependent syllable acoustic models2008
- 著者名/発表者名
  J. Zhang, L. Wang, S. Nakagawa
- 学会等名
  Proc. Asian workshop on Speech Science and Technology
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[学会発表] 講義音声収録映像の音声情報を用いた講義コンテンツの構築と評価2007
- 著者名/発表者名
  富樫慎吾, 中川聖一
- 学会等名
  日本音響学会秋季講演論文集
- 発表場所
  甲府
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 研究成果報告書概要
[学会発表] Construction of spoken language model including fillers using filler prediction model2007
- 著者名/発表者名
  K. Ohta, M. Tsuchiya, S. Nakagawa
- 学会等名
  Proc. InterSpeech
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[学会発表] Automatic extraction of the phrases for important sentences in lecture speech and automatic lecture speech summarization2007
- 著者名/発表者名
  Y. Fujii, N. Kitaoka, S. Nakagawa
- 学会等名
  Proc. InterSpeech
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[学会発表] Error-tolerant question answering for spoken documents2007
- 著者名/発表者名
  T. Akiba, H. Tsujimura
- 学会等名
  Proc. InterSpeech
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[学会発表] 講義音声収録映像の音声情報を用いた講義コンテンツの構築と評価2007
- 著者名/発表者名
  富樫慎吾, 中川聖一
- 学会等名
  日本音響学会秋季講演論文集
- 発表場所
  甲府
- 関連する報告書
  2007 実績報告書
[図書] Spoken Language Systems2005
- 著者名/発表者名
  S.Nakagawa, M.Okada, T.Kawahara
- 総ページ数
  347
- 出版者
  Ohmsha, IOS Press
- 関連する報告書
  2005 実績報告書
[備考] 「研究成果報告書概要(和文)」より
- URL
  http://www.slp.ics.tut.ac.jp/CJLC/
- 関連する報告書
  2007 研究成果報告書概要

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

研究代表者

中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)

16,030千円 (直接経費: 14,800千円、間接経費: 1,230千円)

報告書

研究成果

[雑誌論文] 講義音声ドキュメントのコンテンツ化と視聴システム2008

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] Useful Contents of Classroom Lecture Speech and Browsing System(in Japanese)2008

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] 講義音声ドキュメンのコンテンツ化と視聴システム2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 機械学習を用いた日本語機能表現のチャンキング2007

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 講義ドキュメントのコンテンツ化と視聴システムの試作2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 講義コンテンツの収集・分析および講義音声の認識手法に関する検討2007

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 日本語複合辞書用例データベースの作成と分析2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Robust Distant Speech Recognition by Combining Multiple Microhone-array Processing with Position Dependent CMN2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 音声対話機能を備えた音色識別学習支援システム2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Text-independent/text-prompted speaker recognition by combining speaker-specific GMM with speaker adapted syllable-based HMM2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Response timing detection using prosodic and linguistic information for human-freindly spoken dialog systems2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] フォーム型Web情報検索サービスのための音声ユーザインタフェースシステムと操作性の評価2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 日英関連報道記事を用いた訳語対応推定2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 表層的言語情報と韻律情報を用いた講演音声の重要文抽出2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] CALLと音声情報処理技術2005

著者名/発表者名

雑誌名

関連する報告書

[学会発表] フィラー予測モデルを用いた話し言葉言語モデルの音声認識による評価2008

著者名/発表者名

学会等名

発表場所

中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)