2006 Fiscal Year Annual Research Report

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

Research Project

Project/Area Number	17300064
Research Institution	Toyohashi University of Technology
Principal Investigator	中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)
Co-Investigator(Kenkyū-buntansha)	秋葉友良豊橋技術科学大学, 工学部, 准教授 (00356346) 北岡教英名古屋大学, 大学院・情報学研究科, 准教授 (10333501) 土屋雅稔豊橋技術科学大学, 工学部, 助教 (70378256) 小暮悟静岡大学, 情報学部, 助教 (40359758) 西崎博光山梨大学, 大学院医学工学総合研究部, 助教 (40362082)
Keywords	音声認識 / 講義音声 / 音声ドキュメント / インデキシング / 音声要約 / ブラウジング
Research Abstract	平成17年度と平成18年度で、延べ40時間以上の講義を収録した。これらの音声データのうち、大半のデータに対して書き起こし、間投詞などのフィラー、言い淀み・言いなおし、倒置などのラベルもCSJ話し言葉コーパスに準拠して付与した。これらのデータに対して、話し言葉特有の現象を分析し、講演音声のデータと比較した。予想に反して、講義音声は講演音声よりもフィラーが少ないこと、言い淀み・言いなおし・倒置表現が比較的少ないことが明らかとなった。昨年度に引き続き、この講義音声の音声認識方法に関し検討した。マイク等の収録条件による影響を除去するために、伝達関数の正規化に相当する種々のケプストラムの正規化法を検討した。それらは、ケプストラム平均正規化、ケプストラム分散正規化、ケプストラムヒストグラム正規化である。また、話し言葉音声認識の高精度化の研究を引き続き行った。それらは、ワンパストライグラムデコーダの高精度化、単語単位の音響モデル化、言語モデルの適応化、等である。話し言葉の言語モデルの構築は、フィラーの存在のために、大量に入手できる書き言葉から学習することが困難である。そこで、フィラーの挿入モデルを機械学習の方法で実現し、その有効性を確かめた。また、要約に関して、重要文特有の表現を機械学習の方法で獲得し、この表現の抽出結果を併用することにより、我々の従来の要約手法の精度を向上できた。講義音声の要約や講義資料と講義音声認識結果の解析によるキーワードを抽出してインデックス化する、音声とキーワードとの対応付けを自動的に行う、要約率と話速を自由に設定できる、等の機能を備えたコンテンツ視聴システムのプロトタイプを実現した。

Research Products
(6 results)

All 2007 2006

All Journal Article (6 results)

[Journal Article] 機械学習を用いた日本語機能表現のチャンキング2007
- Author(s)
  土屋雅稔, 注連隆夫, 高木俊宏, 内元清貴, 松吉俊, 宇津呂武仁, 佐藤理史, 中川聖一
- Journal Title
  
  自然言語処理 Vol.14 No.1
  
  Pages: 111-138
[Journal Article] 講義ドキュメントのコンテンツ化と視聴システムの試作2007
- Author(s)
  富樫慎吾, 藤井康寿, 北岡教英, 中川聖一
- Journal Title
  
  第1回音声ドキュメント処理ワークショップ講演論文集
  
  Pages: 17-24
[Journal Article] 講義コンテンツの収集・分析および講義音声の認識手法に関する検討2007
- Author(s)
  小暮悟, 西崎博光, 土屋雅稔, 中川聖一
- Journal Title
  
  第1回音声ドキュメント処理ワークショップ講演論文集
  
  Pages: 1-8
[Journal Article] 日本語複合辞書用例データベースの作成と分析2006
- Author(s)
  土屋雅稔, 宇津呂武仁, 松吉俊, 佐藤理史, 中川聖一
- Journal Title
  
  情報処理学会論文誌 47(6)
  
  Pages: 1728-1742
[Journal Article] Robust Distant Speech Recognition by Combining Multiple Microhone-array Processing with Position Dependent CMN2006
- Author(s)
  L.Wang, N.Kitaoka, S.Nakagawa
- Journal Title
  
  Eurasip Journal on Applied Signal Processing (95491)
  
  Pages: 1-11
[Journal Article] 音声対話機能を備えた音色識別学習支援システム2006
- Author(s)
  渡辺裕太, 瀾口芳廣, 西崎博光
- Journal Title
  
  情報処理学会論文誌 Vol.42 No.12
  
  Pages: 3173-3184

2006 Fiscal Year Annual Research Report

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

Principal Investigator

中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)

Research Products

[Journal Article] 機械学習を用いた日本語機能表現のチャンキング2007

Author(s)

Journal Title

[Journal Article] 講義ドキュメントのコンテンツ化と視聴システムの試作2007

Author(s)

Journal Title

[Journal Article] 講義コンテンツの収集・分析および講義音声の認識手法に関する検討2007

Author(s)

Journal Title

[Journal Article] 日本語複合辞書用例データベースの作成と分析2006

Author(s)

Journal Title

[Journal Article] Robust Distant Speech Recognition by Combining Multiple Microhone-array Processing with Position Dependent CMN2006

Author(s)

Journal Title

[Journal Article] 音声対話機能を備えた音色識別学習支援システム2006

Author(s)

Journal Title

中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)