2011 Fiscal Year Research-status Report

スライドと音声を組み合わせた講義コンテンツの構造化と要約に関する研究

Research Project

Project/Area Number	23700115
Research Institution	Toyohashi University of Technology
Principal Investigator	土屋雅稔豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)
Project Period (FY)	2011-04-28 – 2014-03-31
Keywords	音声認識 / 機能表現
Research Abstract	講義音声には，多くの話し言葉的現象(フィラー，ポーズ，言い淀み，言い直しなど)が含まれる．H23年度は，それらの話し言葉的現象に対して頑健な自動音声認識を実現するための研究を行った．自発的に発声される話し言葉音声には，言語的な区切りとは無関係な位置に多数のポーズが出現するため，コーパス中の句読点をポーズとみなして言語モデルを学習しても，ポーズのモデル化は不十分になってしまう．そのため，日本語話し言葉コーパスに収録された音声情報からポーズ出現一に関するモデル(ポーズ挿入モデル)を学習し，ポーズ情報を含まないコーパス(国会会議録)を組み合わせることによって，ポーズに対応した言語モデルを構築する方法を提案し，その有効性を示した(雑誌論文1件)．言い淀み・言い直しについては，言い淀み・言い直しに対応した言語モデルを構築するために，言い淀み・言い直し情報が整形されて失われている国会会議録テキストと元の音声情報とを対応付ける方法について検討した．提案手法は，音響的素性に基づく会議録テキストと音声情報の強制アラインメントと，強制アラインメントによって得られた素性に基づいて整形個所を検出する識別器からなる(国際会議発表1件，研究会報告1件)．また，日本語には，複数の語がひとかたまりの表現として非構成的な意味を持ち，機能的関係を表すようになった機能表現が多数存在する．含意関係抽出を行うには，意味的に類似している内容語だけでなく，意味的に類似している機能語と機能表現(例えば，「について」と「に関して」)の差異を吸収する必要がある．その前段階として，多種多様な機能表現の用法を判定する方法について検討した(全国大会発表1件)．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason H23年度は，講義音声を対象とする自動音声認識，書き言葉を対象とする機能表現の用法判定については順調に進捗した．ただし，H23年度の検討により，講義音声を対象とする自動音声認識は，依然としてかなり難しいタスクであることもはっきりとした．そのため，講義音声とスライド要素との自動対応付けについても，予想よりも難しいタスクであることが分かってきた．
Strategy for Future Research Activity	H23年度に引き続き，高精度な講義音声認識と機能表現抽出に取り組む．また，スライド要素および要約の正解データを作成し，それらのデータを用いた評価を進める．
Expenditure Plans for the Next FY Research Funding	H23年度の検討により，講義音声を対象とする自動音声認識は，依然としてかなり難しいタスクであることもはっきりとした．そのため，講義音声とスライド要素との自動対応付けについても，予想よりも難しいタスクであることが分かってきた．そのため，スライド要素および要約の正解データを作成予定が遅れている．そのため，データ作成に関わる謝金について次年度使用が発生した．H24年度については，スライド要素および要約の正解データ作成などの作業と，それらのデータを用いた評価を進める予定である．

Research Products

(5 results)

All 2012 2011

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results)

[Journal Article] ポーズを考慮した話し言葉言語モデルの構築2012
- Author(s)
  太田健吾, 土屋雅稔, 中川聖一
- Journal Title
  
  情報処理学会論文誌
  
  Volume: 53 Pages: 889-900
- Peer Reviewed
[Presentation] 『現代日本語書き言葉均衡コーパス』における複合辞の検出と評価2012
- Author(s)
  鈴木敬文, 阿部佑亮, 宇津呂武仁, 松吉俊, 土屋雅稔
- Organizer
  コーパス日本語学ワークショップ
- Place of Presentation
  国立国語研究所
- Year and Date
  2012年3月5日
[Presentation] 整形された書き起こしからの整形・非整形部分の自動検出2012
- Author(s)
  太田健吾, 土屋雅稔, 中川聖一
- Organizer
  第6回音声ドキュメント処理ワークショップ
- Place of Presentation
  豊橋技術科学大学
- Year and Date
  2012年3月3日
[Presentation] 代表・派生関係を利用した日本語機能表現の解析方式の評価2012
- Author(s)
  鈴木敬文, 阿部佑亮, 宇津呂武仁, 松吉俊, 土屋雅稔
- Organizer
  言語処理学会第18回年次大会
- Place of Presentation
  広島市立大学
- Year and Date
  2012年3月15日
[Presentation] Detection of Precisely Transcribed Parts from Inexact Transcribed Corpus2011
- Author(s)
  Kengo Ohta, Masatoshi Tsuchiya, Seiichi Nakagawa
- Organizer
  Automatic Speech Recognition and Understanding Workshop
- Place of Presentation
  アメリカ・ハワイ
- Year and Date
  2011年12月15日

2011 Fiscal Year Research-status Report

スライドと音声を組み合わせた講義コンテンツの構造化と要約に関する研究

Principal Investigator

土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)

Current Status of Research Progress

Reason

Research Products

[Journal Article] ポーズを考慮した話し言葉言語モデルの構築2012

Author(s)

Journal Title

[Presentation] 『現代日本語書き言葉均衡コーパス』における複合辞の検出と評価2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 整形された書き起こしからの整形・非整形部分の自動検出2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 代表・派生関係を利用した日本語機能表現の解析方式の評価2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Detection of Precisely Transcribed Parts from Inexact Transcribed Corpus2011

Author(s)

Organizer

Place of Presentation

Year and Date

土屋雅稔豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)