2007 Fiscal Year Annual Research Report

話し言葉音声コミュニケーションの構造の抽出と視覚化

Research Project

Project/Area Number	19300061
Research Institution	Kyoto University
Principal Investigator	河原達也 Kyoto University, 学術情報メディアセンター, 教授 (00234104)
Co-Investigator(Kenkyū-buntansha)	中村裕一京都大学, 学術情報メディアセンター, 教授 (40227947) 秋田祐哉京都大学, 学術情報メディアセンター, 助教 (90402742) 内元清貴独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター, 主任研究員 (60358885)
Keywords	話し言葉 / 音声認識 / 言語解析 / 映像解析 / メディア検索
Research Abstract	講演・講義や会議・ミーティングなどの大規模な音声アーカイブの効果的な利活用を指向して,このような長時間の話し言葉音声を自動書き起こし(音声認識)するとともに,多層の言語的・談話的構造を抽出し,字幕化を含めて効果的に提示する方法について研究を行った. まず,話し言葉から節境界及び文境界を自動的に推定するために,サポートベクトルマシン(SVM)を用いたテキストチャンキングによる手法の高精度化を検討した.単語やポーズの情報に加えて,韻律的特徴や局所的な係り受けなどの言語的情報の導入を行い,書き起こしでは局所的な係り受け情報が,音声認識結果では韻律的特徴が効果的であることを確認した.次に,講演の書き起こしから講演録を作成する際の過程をモデル化し,実際にそのようなアノテーションを行ってもらった.その整形の過程で削除される箇所を自動的に推定する手法についても検討した. また,会話中の映像や人間の動作・視線など,非言語的ふるまいを含んだ会話データを収録可能な環境を構築し,講演と討論の中間的な特徴を有するポスター会話というタスクを設定して,多数のセンサを用いてマルチモーダルなデータの収録を行った.収録データに対して,節単位や談話セグメントなどの言語的単位と非言語的ふるまいのアノテーションを行った.うなずき,視線方向,ポインティングの3種類の非言語的ふるまいについて,談話セグメント,節単位,あいづちとの相関に関する分析を行った.

Research Products
(5 results)

All 2008 2007

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Book (1 results)

[Journal Article] 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識.2008
- Author(s)
  南條浩輝, 河原達也, 七里崇.
- Journal Title
  
  電子情報通信学会論文誌 J91-D
  
  Pages: 1314-1324
- Peer Reviewed
[Journal Article] 質問応答・情報推薦機能を備えた音声による情報案内システム.2007
- Author(s)
  翠輝久, 河原達也, 正司哲朗, 美濃導彦.
- Journal Title
  
  情報処理学会論文誌 48
  
  Pages: 3602-3611
- Peer Reviewed
[Journal Article] ドメインとスタイルを考慮したwebテキストの選択による音声対話システム用言語モデルの構築.2007
- Author(s)
  翠輝久, 河原達也.
- Journal Title
  
  電子情報通信学会論文誌 J90-D
  
  Pages: 3024-3032
- Peer Reviewed
[Presentation] Speech-based interactive information guidance systemusing question-answering technique.2007
- Author(s)
  T. Misu and T. Kawahara.
- Organizer
  IEEE-ICASSP
- Place of Presentation
  アメリカ合衆国
- Year and Date
  2007-04-18
[Book] Springer Handbook of Speech Processing2008
- Author(s)
  Sadaoki Furui and Tatsuya Kawahara
- Total Pages
  627-651
- Publisher
  Springer

2007 Fiscal Year Annual Research Report

話し言葉音声コミュニケーションの構造の抽出と視覚化

Principal Investigator

河原 達也 Kyoto University, 学術情報メディアセンター, 教授 (00234104)

Research Products

[Journal Article] 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識.2008

Author(s)

Journal Title

[Journal Article] 質問応答・情報推薦機能を備えた音声による情報案内システム.2007

Author(s)

Journal Title

[Journal Article] ドメインとスタイルを考慮したwebテキストの選択による音声対話システム用言語モデルの構築.2007

Author(s)

Journal Title

[Presentation] Speech-based interactive information guidance systemusing question-answering technique.2007

Author(s)

Organizer

Place of Presentation

Year and Date

[Book] Springer Handbook of Speech Processing2008

Author(s)

Total Pages

Publisher

河原達也 Kyoto University, 学術情報メディアセンター, 教授 (00234104)