2007 年度実績報告書

話し言葉音声コミュニケーションの構造の抽出と視覚化

研究課題

研究課題/領域番号	19300061
研究機関	京都大学
研究代表者	河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)
研究分担者	中村裕一京都大学, 学術情報メディアセンター, 教授 (40227947) 秋田祐哉京都大学, 学術情報メディアセンター, 助教 (90402742) 内元清貴独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター, 主任研究員 (60358885)
キーワード	話し言葉 / 音声認識 / 言語解析 / 映像解析 / メディア検索
研究概要	講演・講義や会議・ミーティングなどの大規模な音声アーカイブの効果的な利活用を指向して,このような長時間の話し言葉音声を自動書き起こし(音声認識)するとともに,多層の言語的・談話的構造を抽出し,字幕化を含めて効果的に提示する方法について研究を行った. まず,話し言葉から節境界及び文境界を自動的に推定するために,サポートベクトルマシン(SVM)を用いたテキストチャンキングによる手法の高精度化を検討した.単語やポーズの情報に加えて,韻律的特徴や局所的な係り受けなどの言語的情報の導入を行い,書き起こしでは局所的な係り受け情報が,音声認識結果では韻律的特徴が効果的であることを確認した.次に,講演の書き起こしから講演録を作成する際の過程をモデル化し,実際にそのようなアノテーションを行ってもらった.その整形の過程で削除される箇所を自動的に推定する手法についても検討した. また,会話中の映像や人間の動作・視線など,非言語的ふるまいを含んだ会話データを収録可能な環境を構築し,講演と討論の中間的な特徴を有するポスター会話というタスクを設定して,多数のセンサを用いてマルチモーダルなデータの収録を行った.収録データに対して,節単位や談話セグメントなどの言語的単位と非言語的ふるまいのアノテーションを行った.うなずき,視線方向,ポインティングの3種類の非言語的ふるまいについて,談話セグメント,節単位,あいづちとの相関に関する分析を行った.

研究成果

(5件)

すべて 2008 2007

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件) 図書 (1件)

[雑誌論文] 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識.2008
- 著者名/発表者名
  南條浩輝, 河原達也, 七里崇.
- 雑誌名
  
  電子情報通信学会論文誌 J91-D
  
  ページ: 1314-1324
- 査読あり
[雑誌論文] 質問応答・情報推薦機能を備えた音声による情報案内システム.2007
- 著者名/発表者名
  翠輝久, 河原達也, 正司哲朗, 美濃導彦.
- 雑誌名
  
  情報処理学会論文誌 48
  
  ページ: 3602-3611
- 査読あり
[雑誌論文] ドメインとスタイルを考慮したwebテキストの選択による音声対話システム用言語モデルの構築.2007
- 著者名/発表者名
  翠輝久, 河原達也.
- 雑誌名
  
  電子情報通信学会論文誌 J90-D
  
  ページ: 3024-3032
- 査読あり
[学会発表] Speech-based interactive information guidance systemusing question-answering technique.2007
- 著者名/発表者名
  T. Misu and T. Kawahara.
- 学会等名
  IEEE-ICASSP
- 発表場所
  アメリカ合衆国
- 年月日
  2007-04-18
[図書] Springer Handbook of Speech Processing2008
- 著者名/発表者名
  Sadaoki Furui and Tatsuya Kawahara
- 総ページ数
  627-651
- 出版者
  Springer

2007 年度 実績報告書

話し言葉音声コミュニケーションの構造の抽出と視覚化

研究代表者

河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)

研究成果

[雑誌論文] 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識.2008

著者名/発表者名

雑誌名

[雑誌論文] 質問応答・情報推薦機能を備えた音声による情報案内システム.2007

著者名/発表者名

雑誌名

[雑誌論文] ドメインとスタイルを考慮したwebテキストの選択による音声対話システム用言語モデルの構築.2007

著者名/発表者名

雑誌名

[学会発表] Speech-based interactive information guidance systemusing question-answering technique.2007

著者名/発表者名

学会等名

発表場所

年月日

[図書] Springer Handbook of Speech Processing2008

著者名/発表者名

総ページ数

出版者

2007 年度実績報告書

河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)