1995 年度研究成果報告書概要

視覚情報と言語情報の統合によるプレゼンテーションの自動認識に関する研究

研究課題

研究課題/領域番号	06452396
研究種目	一般研究(B)
配分区分	補助金
研究分野	知能情報学
研究機関	筑波大学
研究代表者	大田友一筑波大学, 電子・情報工学系, 教授 (50115804)
研究分担者	中村裕一筑波大学, 電子・情報工学系, 講師 (40227947)
研究期間 (年度)	1994 – 1995
キーワード	人物行動理解 / 映像の構造化 / 動作と発話の関係 / 自然言語処理 / 画像理解 / メディアの統合 / ヒューマンインタフェース / プレゼンテーション
研究概要	本研究では,人間や計算機とのコミュニケーションにおける視覚情報と言語情報を,統合的に解析し,それを用いる手法について研究を行った.特に,プレゼンテーションにおける送り手順の意図,及びそれを認識するための種々の要因について調査を行い,それを自動的に特定するための基本的な手法を提案した. 1.プレゼンテーション映像における話者の動作認識に関する研究:プレゼンテーションを記録した映像から,人物の動作やジェスチャの解析を行い,視覚的イベントとして抽出する方法;言語情報を解析し,指示語や形状を表現する語など,視覚的イベントと密接に関連する言語現象を抽出する方法;時間スケール上でのタイミングを考慮して,両者を対応づけ,視覚的イベントの意味解釈を行う方法について研究し,新しい手法を提案した. 2.画像処理・音声処理を用いた映像データの時間的構造化に関する研究:大量に保存されている映像データを自動的に構造化し,検索や再利用可能なデータとして蓄積する基礎研究を行った.この研究では特に,短い時間にわかりやすい主張が込められているコマーシャル映像を題材にし,その意味的な構造化手法を提案した. 3.図的情報(パターン情報)と自然言語情報の統合によるメディア理解と説明の生成:これまでただ単に混在して提示されることの多かった図的メディアとテキストのような自然言語情報を自動的に関係付けるための研究を行った.これにより,双方のメディアの持つ情報を相補的に用い,片方のメディアでは解釈の難しい事項を簡単に処理できることを明らかにした.また,その結果から自動的にハイパーメディアを構築する手法を提案した. 4.関連研究(新しいコミュニケーション手段を構築するための基礎的研究) :従来から,種々のコミュニケーションで必要となる顔画像の扱いについて,簡便かつ十分な質を持った画像を生成する方法を提案した.

研究成果
(12件)

すべてその他

すべて文献書誌 (12件)

[文献書誌] 中村裕一: "プレゼンテーション映像における話者の行動理解" 信学技報パターン認識・理解. 95-143. 51-56 (1995)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] 上堀幸代: "画像特徴を音響特徴を利用したCM映像の自動的構造化手法" 信学技報パターン認識・理解. 95-159. 9-12 (1995)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] 向川康博: "Synthesis of Arbitrarily Iriented Face Views from Two Omages" Asian Conference on Computer Vision, Singapore. 3. 718-722 (1995)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] 角保志: "Detection of Face Orientation and Facial Components Using Distributed Appearance Model" Int. Workshop on Automatic Face-and Gesture Recognition. 254-259 (1995)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] 中村裕一: "Knowledge Extraction from Diagram and Text for Media Integration" Proc. Int. Conference on Multimedia Computing and Systems. (to be published). (1995)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] 中村裕一: "認識と生成を双方向に行なうための多重解像度表現 --ウェーブレット極値による形状生成/編集--" 信学技報パターン認識・理解. 95-172. 39-46 (1996)
- 説明
  「研究成果報告書概要(和文)」より
[文献書誌] Yuichi Nakamura, Masashi Nishitani, Yuichi Ohta: "Human Behavior Understanding in Oral Presentation" IEICE Technical Report SIG-PRU. Vol.95-143. 51-56 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Yukiyo Uehori, Mitsuhiro Murata, Yuichi Nakamura, Yuichi Ohta: "Temporal Structure Analysis of Television Commercial by Image and Sound Processing" IEICE Technical Report SIG-PRU. Vol.95-159. 9-12 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Yasuhiro Mukaigawa, Yuichi Nakamura, Yuichi Ohta: "Synthesis of Arbitrarily Oriented Face Views from Two Images" Asian Conf.On Computer Vision. Vol.3. 718-722 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Yasushi Sumi, Yuichi Ohta: "Detection of Face Orientation and Facial Components Using Distributed Appearance Model" Int.Workshop Automatic Face-and Gesture Recognition. 254-259 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Yuichi Nakamura, Miwa Takahashi, Masayuki Onda, Yuichi Ohta: "Knowledge Extraction from Diagram and Text for Media Integration" IEEE Multimedia Computing and Systems. (to be published). (1996)
- 説明
  「研究成果報告書概要(欧文)」より
[文献書誌] Yuichi Nakamura, Yuichi Ohta: "Multiresolutional Pattern Description for Bi-directional Analysis" IEICE Technical Report SIG-PRU. Vol.95-172. 39-46 (1995)
- 説明
  「研究成果報告書概要(欧文)」より

1995 年度 研究成果報告書概要

視覚情報と言語情報の統合によるプレゼンテーションの自動認識に関する研究

研究代表者

大田 友一 筑波大学, 電子・情報工学系, 教授 (50115804)

研究成果

[文献書誌] 中村裕一: "プレゼンテーション映像における話者の行動理解" 信学技報 パターン認識・理解. 95-143. 51-56 (1995)

説明

[文献書誌] 上堀幸代: "画像特徴を音響特徴を利用したCM映像の自動的構造化手法" 信学技報 パターン認識・理解. 95-159. 9-12 (1995)

説明

[文献書誌] 向川康博: "Synthesis of Arbitrarily Iriented Face Views from Two Omages" Asian Conference on Computer Vision, Singapore. 3. 718-722 (1995)

説明

[文献書誌] 角 保志: "Detection of Face Orientation and Facial Components Using Distributed Appearance Model" Int. Workshop on Automatic Face-and Gesture Recognition. 254-259 (1995)

説明

[文献書誌] 中村裕一: "Knowledge Extraction from Diagram and Text for Media Integration" Proc. Int. Conference on Multimedia Computing and Systems. (to be published). (1995)

説明

[文献書誌] 中村裕一: "認識と生成を双方向に行なうための多重解像度表現 --ウェーブレット極値による形状生成/編集--" 信学技報 パターン認識・理解. 95-172. 39-46 (1996)

説明

[文献書誌] Yuichi Nakamura, Masashi Nishitani, Yuichi Ohta: "Human Behavior Understanding in Oral Presentation" IEICE Technical Report SIG-PRU. Vol.95-143. 51-56 (1995)

説明

[文献書誌] Yukiyo Uehori, Mitsuhiro Murata, Yuichi Nakamura, Yuichi Ohta: "Temporal Structure Analysis of Television Commercial by Image and Sound Processing" IEICE Technical Report SIG-PRU. Vol.95-159. 9-12 (1995)

説明

[文献書誌] Yasuhiro Mukaigawa, Yuichi Nakamura, Yuichi Ohta: "Synthesis of Arbitrarily Oriented Face Views from Two Images" Asian Conf.On Computer Vision. Vol.3. 718-722 (1995)

説明

[文献書誌] Yasushi Sumi, Yuichi Ohta: "Detection of Face Orientation and Facial Components Using Distributed Appearance Model" Int.Workshop Automatic Face-and Gesture Recognition. 254-259 (1995)

説明

[文献書誌] Yuichi Nakamura, Miwa Takahashi, Masayuki Onda, Yuichi Ohta: "Knowledge Extraction from Diagram and Text for Media Integration" IEEE Multimedia Computing and Systems. (to be published). (1996)

説明

[文献書誌] Yuichi Nakamura, Yuichi Ohta: "Multiresolutional Pattern Description for Bi-directional Analysis" IEICE Technical Report SIG-PRU. Vol.95-172. 39-46 (1995)

説明

1995 年度研究成果報告書概要

大田友一筑波大学, 電子・情報工学系, 教授 (50115804)

[文献書誌] 中村裕一: "プレゼンテーション映像における話者の行動理解" 信学技報パターン認識・理解. 95-143. 51-56 (1995)

[文献書誌] 上堀幸代: "画像特徴を音響特徴を利用したCM映像の自動的構造化手法" 信学技報パターン認識・理解. 95-159. 9-12 (1995)

[文献書誌] 角保志: "Detection of Face Orientation and Facial Components Using Distributed Appearance Model" Int. Workshop on Automatic Face-and Gesture Recognition. 254-259 (1995)

[文献書誌] 中村裕一: "認識と生成を双方向に行なうための多重解像度表現 --ウェーブレット極値による形状生成/編集--" 信学技報パターン認識・理解. 95-172. 39-46 (1996)