• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

講義・講演音声の自動インデキシング化と音声インタラクションによる高度利用の研究

Research Project

Project/Area Number 17300064
Research InstitutionToyohashi University of Technology

Principal Investigator

中川 聖一  豊橋技術科学大学, 工学部, 教授 (20115893)

Co-Investigator(Kenkyū-buntansha) 秋葉 友良  豊橋技術科学大学, 工学部, 助教授 (00356346)
北岡 教英  豊橋技術科学大学, 工学部, 講師 (10333501)
土屋 雅稔  豊橋技術科学大学, 工学部, 助手 (70378256)
小暮 悟  静岡大学, 情報学部, 助手 (40359758)
西崎 博光  山梨大学, 大学院・医学工学総合研究部, 助手 (40362082)
Keywords音声認識 / 講義音声 / 音声ドキュメント / インデキシング / 音声要約
Research Abstract

本年度は、講演や講義の音声ドキュメントの高度利用化のために必要な要素技術である音声認識、音声要約、音声ドキュメントのセグメンテーション、音声ドキュメントのインディクス化の研究を行った。
音声認識の高精度化のためには、我々の研究室で開発してきた大語彙連続音声認識システムSPOJUSの改良を行った。コンテキスト依存音響モデルとトライグラム言語モデルを1パス目に組み込むことにより、従来より認識精度を高めることができた。次に、実際の講義音声に対して、音声認識実験を行い、録音機材や音響モデル等による認識率の影響を検討した。さらに、講演音声や講義音声の要約の研究も行った。発話時間長、ピッチやパワー情報、ポーズ長、文の位置情報、手がかり語、重要語の出現頻度などを組み合わせることによる自動要約手法で、それぞれF値は、人間の要約と遜色のない0.599、0.524が得られた。また、講演音声や講義音声を音声認識システムで自動的に書き起こしたテキストデータに対しても要約を行い、音声認識による精度の低下は小さく比較的良い要約結果が得られた。講義音声のコンテンツ化の一貫として、講義音声の書き起こしテキストからキーワードを抽出しインデックスとすることも試みた。人手で書き起こしたテキストに対しては、ほぼ完壁にインデックスを作成することができた。
静岡大学と山梨大学では、講義内容の動画の収集と音声の収集(DAT)を行った.現在,収録した動画から音声データを抽出し、書き起こし作業を人手で行っている。未知語や認識誤り等の対処法の検討については、文法による認識と平行して,ワードスポッティングを用いる音声認識手法についての検討を行った。また、講義や講演において、重要部分を発話するときに、平常音声と比べどのような音響的特徴の差異がでるのかを調べ、有意義な知見を得た。

  • Research Products

    (7 results)

All 2006 2005

All Journal Article (6 results) Book (1 results)

  • [Journal Article] Text-independent/text-prompted speaker recognition by combining speaker-specific GMM with speaker adapted syllable-based HMM2006

    • Author(s)
      S.Nakagawa, W.Zhang, M.Takahashi
    • Journal Title

      Trans.IEICE, Information & Systems Vol.E89-D No.3

  • [Journal Article] Response timing detection using prosodic and linguistic information for human-freindly spoken dialog systems2005

    • Author(s)
      N.Kitaoka, M.Takeuchi, R.Nishimura, S.Nakagawa
    • Journal Title

      人工知能学会論文誌 Vol.20, No.3

      Pages: 220-228

  • [Journal Article] フォーム型Web情報検索サービスのための音声ユーザインタフェースシステムと操作性の評価2005

    • Author(s)
      甲斐充彦, 盛浩和, 仲野崇広, 中川聖一
    • Journal Title

      情報処理学会論文誌 Vol.46, No.5

      Pages: 1319-1329

  • [Journal Article] 日英関連報道記事を用いた訳語対応推定2005

    • Author(s)
      宇津呂武彦, 日野浩平, 堀内貴司, 中川聖一
    • Journal Title

      自然言語処理 Vol.12, No.5

      Pages: 43-68

  • [Journal Article] 表層的言語情報と韻律情報を用いた講演音声の重要文抽出2005

    • Author(s)
      小林聡, 山口優, 中川聖一
    • Journal Title

      自然言語処理 Vol.12, No.6

      Pages: 3-23

  • [Journal Article] CALLと音声情報処理技術2005

    • Author(s)
      中川聖一
    • Journal Title

      音声研究 Vol.9, No.2

      Pages: 28-37

  • [Book] Spoken Language Systems2005

    • Author(s)
      S.Nakagawa, M.Okada, T.Kawahara
    • Total Pages
      347
    • Publisher
      Ohmsha, IOS Press

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi