• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実施状況報告書

スライドと音声を組み合わせた講義コンテンツの構造化と要約に関する研究

研究課題

研究課題/領域番号 23700115
研究機関豊橋技術科学大学

研究代表者

土屋 雅稔  豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)

研究期間 (年度) 2011-04-28 – 2014-03-31
キーワード音声認識 / 機能表現
研究概要

講義音声には,多くの話し言葉的現象(フィラー,ポーズ,言い淀み,言い直しなど)が含まれる.H23年度は,それらの話し言葉的現象に対して頑健な自動音声認識を実現するための研究を行った.自発的に発声される話し言葉音声には,言語的な区切りとは無関係な位置に多数のポーズが出現するため,コーパス中の句読点をポーズとみなして言語モデルを学習しても,ポーズのモデル化は不十分になってしまう.そのため,日本語話し言葉コーパスに収録された音声情報からポーズ出現一に関するモデル(ポーズ挿入モデル)を学習し,ポーズ情報を含まないコーパス(国会会議録)を組み合わせることによって,ポーズに対応した言語モデルを構築する方法を提案し,その有効性を示した(雑誌論文1件).言い淀み・言い直しについては,言い淀み・言い直しに対応した言語モデルを構築するために,言い淀み・言い直し情報が整形されて失われている国会会議録テキストと元の音声情報とを対応付ける方法について検討した.提案手法は,音響的素性に基づく会議録テキストと音声情報の強制アラインメントと,強制アラインメントによって得られた素性に基づいて整形個所を検出する識別器からなる(国際会議発表1件,研究会報告1件).また,日本語には,複数の語がひとかたまりの表現として非構成的な意味を持ち,機能的関係を表すようになった機能表現が多数存在する.含意関係抽出を行うには,意味的に類似している内容語だけでなく,意味的に類似している機能語と機能表現(例えば,「について」と「に関して」)の差異を吸収する必要がある.その前段階として,多種多様な機能表現の用法を判定する方法について検討した(全国大会発表1件).

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

H23年度は,講義音声を対象とする自動音声認識,書き言葉を対象とする機能表現の用法判定については順調に進捗した.ただし,H23年度の検討により,講義音声を対象とする自動音声認識は,依然としてかなり難しいタスクであることもはっきりとした.そのため,講義音声とスライド要素との自動対応付けについても,予想よりも難しいタスクであることが分かってきた.

今後の研究の推進方策

H23年度に引き続き,高精度な講義音声認識と機能表現抽出に取り組む.また,スライド要素および要約の正解データを作成し,それらのデータを用いた評価を進める.

次年度の研究費の使用計画

H23年度の検討により,講義音声を対象とする自動音声認識は,依然としてかなり難しいタスクであることもはっきりとした.そのため,講義音声とスライド要素との自動対応付けについても,予想よりも難しいタスクであることが分かってきた.そのため,スライド要素および要約の正解データを作成予定が遅れている.そのため,データ作成に関わる謝金について次年度使用が発生した.H24年度については,スライド要素および要約の正解データ作成などの作業と,それらのデータを用いた評価を進める予定である.

  • 研究成果

    (5件)

すべて 2012 2011

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件)

  • [雑誌論文] ポーズを考慮した話し言葉言語モデルの構築2012

    • 著者名/発表者名
      太田 健吾, 土屋 雅稔, 中川 聖一
    • 雑誌名

      情報処理学会論文誌

      巻: 53 ページ: 889-900

    • 査読あり
  • [学会発表] 『現代日本語書き言葉均衡コーパス』における複合辞の検出と評価2012

    • 著者名/発表者名
      鈴木 敬文, 阿部 佑亮, 宇津呂 武仁, 松吉 俊, 土屋 雅稔
    • 学会等名
      コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      2012年3月5日
  • [学会発表] 整形された書き起こしからの整形・非整形部分の自動検出2012

    • 著者名/発表者名
      太田 健吾, 土屋 雅稔, 中川 聖一
    • 学会等名
      第6回音声ドキュメント処理ワークショップ
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2012年3月3日
  • [学会発表] 代表・派生関係を利用した日本語機能表現の解析方式の評価2012

    • 著者名/発表者名
      鈴木 敬文, 阿部 佑亮, 宇津呂 武仁, 松吉 俊, 土屋 雅稔
    • 学会等名
      言語処理学会第18回年次大会
    • 発表場所
      広島市立大学
    • 年月日
      2012年3月15日
  • [学会発表] Detection of Precisely Transcribed Parts from Inexact Transcribed Corpus2011

    • 著者名/発表者名
      Kengo Ohta, Masatoshi Tsuchiya, Seiichi Nakagawa
    • 学会等名
      Automatic Speech Recognition and Understanding Workshop
    • 発表場所
      アメリカ・ハワイ
    • 年月日
      2011年12月15日

URL: 

公開日: 2013-07-10  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi